邬贺铨院士：人工智能的魅力是它永远在路上

邬贺铨 ☉ 文来源：军民融合科技创新资讯平台
2019-01-07 @ 哈希力量文库

文库划重点：深度神经网络实际上是个分类器。看好AI在医疗保健、汽车和金融服务的应用，但挑战很大。

1月5日，首届影响力峰会的主题为“预见未来”在北京召开。会上，中国工程院院士邬贺铨担任“预见科技未来”发布人，发表了主题为“迎接人工智能的未来”的演讲。

邬贺铨院士称，人工智能技术现在可以做的事情很多，对经济效益也有很大的贡献。目前来看，AI应用效果比较好的领域有三个，一是医疗保健，二是汽车，三是金融服务业。

不过，邬贺铨院士也同时指出，目前机器学习还有很多不足，一个诺贝尔奖经济学奖得主（Judea Pear）说“人工智能不过是统计学”，还是有很多不足的地方。

对于人工智能下一步如何进化，邬贺铨院士引用清华大学张钹院士的观点说，我们要把感知和认知放到同一个空间里，不是简单用概率统计的理论，要用模糊级的理论来重新定义它。或者，发展群体智能。

邬贺铨院士在演讲中表示，互联网已经是第50年了，50年的互联网到现在还保持互联网流量年增60%，这些增速也会对未来人工智能技术的发展有很大的影响。“人工智能会使得我们的生活更美好，或是走到我们的反面，这一切取决于人类自己。”邬贺铨说到，人工智能永远在路上，这也就是人工智能的魅力。

以下为邬贺铨院士演讲实录（做了不改动原意的整理）：

各位领导、各位专家早上好。我发言的题目是“迎接人工智能的未来”。

我们可以看看支撑人工智能发展的技术，比如CPU的芯片、存储器、光纤、移动通信、超算、大数据，用十年的时间来看，有些是60多倍，有些是成本两万倍下降，光纤通信10年100倍容量提升，移动通信10年1000倍的速率提升，超算能力1000倍的提升，算法我在这里没写，但等会儿会说到，大数据量大概是32倍的提升。这是前几年统计下来的网络主要设备年均性能改进的增速。

互联网已经是第50年了，50年的互联网到现在还保持互联网流量年增60%，这些增速也会对未来人工智能技术的发展给予很大的影响。

深度神经网络实际上是个分类器

现在深度神经网络，就算你写本书告诉计算机什么是猫什么是狗，它也学不会，但如果像对待人类小孩的教学方式那样，感性地把一堆猫和狗的视频送到深度神经网络，它就会分类，分类结束后，如果照片视频上有标签，它就会知道分的这类是猫。如果篮子里有个小狗，放进去，它照样会分类为“狗”。所以深度神经网络实际上是个分类器，当你告诉它是什么，它就学会了。

机器学习是深度神经网络的主要技术，从近10年里机器学习的论文里可以发现，现在机器学习的技术热点，可以看到神经网络和进化编程等计算密集型算法在机器学习研究中的出色表现。

人每天吃饭大概要输入2500卡路里的能量，卡路里换算成焦耳大概是1000万焦耳，下围棋5个小时大概要消耗人类3.3兆焦耳。AlphaGo跟李世石下棋时用了1000多个CPU，176个GPU，一个CPU功率100W，1个GPU200W，换算出来是173000W（这是以秒计的），如果5小时就是3000兆焦耳，这相当于李世石用的能耗是AlphaGo能耗的千分之一，也就是说，人工智能目前还需要很大的能量支持。

后来隔了一年，改进了AlphaGoZero，换算成TPU，它只是AlphaGo原有1/12（能耗），用1/12的能耗跟AlphaGo下棋，100比0，当时AlphaGo还要搜集所有的围棋棋谱，然后训练三个月，AlphaGoZero只需要了解围棋的规则，两个AlphaGoZero互相对应，能把所有人类没有走过的棋谱都走完，它就能战胜了。所以优化算法、改进硬件，包括GPU替换CPU（提高了三倍），TPU替换GPU（提高了15到30倍）。

最近不单AlphaGo Zero围棋天下无敌，而且通过自学2个小时，还击败了日本的将棋（有点像中国的象棋），自学4个小时，把国际象棋也全部打赢了。

人工智能能做的事情有太多

在医学上，刚刚过去的三个月，谷歌在机器学习又开发了AlphaFold，AlphaGo的折叠，所谓折叠是来预测蛋白质结构的，在蛋白质结构预测的国际竞赛里，打败了所有由人组成的各种团队，这有什么意义？如果能解释蛋白质的结构，我们的很多疾病（包括癌症）可能就会找到解决办法。所以现在很多人工智能用在医学上开发药物，美国人工智能能比医生提早六年诊断出阿兹海默病，医疗人工智能的器械也开始投入商用了。除此之外我们看一看蛋白质折叠结构，我们可以通过人工智能将它解释出来。

我们知道门捷列夫开发元素周期表用了很长时间，现在假设我们不知道元素周期表，利用人工智能程序，几个小时就可以把元素周期表重新定义出来。也就是说，人工智能确实能做好多事。

在语音识别方面，人工智能已经超过了人，一般人类语音识别的错误率是5.1%，现在百度对汉语的语音识别，微软对应于的语音识别已经比这个水平要高了。当然，在嘈杂噪声环境下，识别率现在也只有54%，不过人更识别不了，人还达不到这个水平。

包括人脸识别，中国上海依图科技的人脸识别率在万分之一，误失率前提下可以通过98%，银行柜台人员用肉眼比对，误差一般在1%，也就是说机器准确性是超过人的眼睛的。

当然，动态三维活体检测更难，下面的图是小布什的原相，右边的小部什头像和原图一样，但嘴型和上图的胖子嘴型一样，我们听不出胖子讲什么，但小布什可以通过口形恢复出他讲话的声音，读懂唇语。

我们知道张学友在好几场演唱会上抓到了逃犯，这不是因为张学友，而是演唱会门口的人脸识别门口。所以张学友说“抓逃犯是我的正业，唱歌只是副业”。

机器视觉应用于什么？这是一个肺部CT照片，大家可以从中发现有没有长瘤子、有没有癌症，但CT可以扫描出几百张图片，很麻烦。我们通过人工智能把这些CT照片还原成一个肺，看看有没有纤维化，再看看肺周边的器官怎么样。

语音识别可以用于医学，还有图像识别，可以重建三维影像，比如医学教育，包括在增进医疗手术的辅导可以起到很好的作用。

在产业上，清华和英业达合作（做影像电路板的），影像电路板很复杂，可以看看该连的线是不是连了，不该连的线是不是没连，人的肉眼很容易错检，但利用机器视觉就可以发觉人的肉眼没法儿发现的问题，每年的经济效益9000万。

看好AI在医疗保健、汽车和金融服务的应用，但挑战很大

人工智能对经济效益的贡献，有一些统计，人工智能可以改进劳动生产率，可以激发消费需求、可以提高产品质量，有人预测2017到2030年，人工智能对劳动生产率的贡献超过GDP的55%，其中中国占了全球将近一半，2030年人工智能会带来7万亿美元的GDP增长贡献，占GDP的26.1%，这个数字来源于普华永道，这里面讲了几个领域，是最重要的人工智能应用领域。

AI指数比较高的应用效果比较好的领域是：一是医疗保健，二是汽车，三是金融服务业。

以自动驾驶为例，麦肯锡估计2025年带来的经济规模将达到万亿美元，降低交通事故，每年能挽救3到15万人的生命，减少废气排放90%，麦肯锡还认为到2030年人工智能可以为全球额外贡献13万亿美元的GDP增长，普华永道的估计是15.7万亿，平均年均GDP会增加1.2%。后面那句话更重要：足以比肩19世纪的蒸汽机、20世纪的工业机器人和21世纪的信息技术。

自动驾驶在简单路况中是好的，复杂路况就很难，因为行人和司机不见到都遵守交通规则，很难用训练的办法掌握，还需要驾驶员的经验和知识，而且人类犯错是偶然的，机器一旦犯错可能就是系统性的。

人工智能可以检测肿瘤，但医院还不敢这么用，因为人工智能本身可以告诉你应该做什么，但它不会告诉你为什么，比如人工智能诊断一个病人，最后得出结论“锯掉一条腿”，但不告诉你为什么，那医院敢锯掉腿吗？

还有很多功能是人工智能难以胜任的，神经网络是以输入为导向的算法，首先的前提是大量数据，而且数据要比较准确，如果受了干扰他就很难，医生受干扰可能会产生很多错误，比如北加州一个组织（美国公民自由联盟）利用亚马逊面部识别算法把美国535位国会议员的照片和美国警察局掌握的2.5万名罪犯照片进行比对，发现28个议员被当成了罪犯。分类数据终美国的数据严重偏向白人男性，所以黑皮肤的可能就容易被错认。

目前机器学习还有很多不足，图灵奖的获奖者说，目前机器学习只是曲线的拟合，一个诺贝尔奖经济学奖得主（Judea Pear）说“人工智能不过是统计学”，也就是说目前还是有很多不够的地方。

刚才我用的两张图映射的猫和狗的区别有个曲线，但只要拟合的地方稍微错一点，可能就会发生错误。比如本来是熊猫，在照片上加上一些噪音，机器就可能识别成长臂猿，所以人工智能识别目前来讲还是比较娇气的。

大家看这张图，有人看是顺时针转，有人看是逆时针转，哪怕是同一个人，一会儿看着是顺时针转，眨眨眼睛却变成了逆时针转，究竟是顺还是逆？其实只是左腿在前还是右腿在前的问题，是你的错觉。

为什么会出现这个错觉？因为它正好处于人工智能辨识（包括人辨识）的分界线，这时就可能发生误导。

比如这个图里的圆圈，大家都觉得它是滚动的、是圆的，可是真的是这样吗？每个球都这样走吗？不一定，我们可以看看。实际上每个球走的都是直线，所以人工智能的模型是会被误导的。

这张图中最后一个打问号的地方应该放（几个数字），人很容易看出来应该放哪个，因为第一行232，第二行343，第三行应该是454，可是人工智能就很难看出来，因为人工智能要获得人类常识不是那么容易的。

人工智能的进化与对就业的冲击

当然，神经网络现在还在演进，关键是怎样选择正确框架以及训练，清华大学的张钹院士说我们要把感知和认知放到同一个空间里，不是简单用概率统计的理论，要用模糊级的理论来重新定义它，否则我们没办法跟机器人交流，机器人之间也没办法交流。

机器学习着重于通过数据了解环境，而人类能够同时洞悉不同的环境，群体学习是人类与生俱来的本领，而电脑是不具备的。我曾经跟一个搞人工智能的公司说，识别语音、下围棋都不算什么，能不能组织11人的机器人足球队，什么时候踢赢皇马了，那你就算厉害了，因为11人的机器人足球队是要群体活动的。

刚才谈到就业，实际上人工智能确实会取代很多现在的就业，49%的劳动人口可能会被取代，但一半以上的人是不会被取代的，因为人工智能没有情感，有情感创作的文艺工作是不能被取代的，人工智能不能取代文艺，要由人来做。美国高德纳咨询公司以及世界经济论坛发布的《2018未来就业》报告中都说，实际上取代了一部分工作，但会新增一些工作岗位。人工智能会带来数字鸿沟，发达国家、先进企业，还会拉大社会贫富悬殊，高智能岗位会增加，一般劳动岗位会减少，自动驾驶出了问题是谁的责任？机器人创作的小说、诗歌是否享有相应的知识产权？有法律道德的问题，还有安全问题，如果人工智能杀人了怎么办？

最后，如政府规划中所说的那样，加快发展新一代人工智能，是我们赢得全球科技竞争主动权的重要抓略抓手。

清华大学张钹院士说，我们现在正在通往AI的路上，现在走得并不远，在出发点附近，但人工智能永远在路上，大家要有思想准备，而这也就是人工智能的魅力。

人工智能会使得我们的生活更美好，或是走到我们的反面，这一切取决于人类自己。

谢谢。

哈希力量文库收录，手机端省略本文网址

.长文建议换电脑刷.

【投融资简报库】

鹿明机器人获数亿Pre-A轮融资

OpenAI将收购初创公司Neptune

无界动力完成首轮3亿元融资