搜狗突破AI语音变声技术 王小川说的话变成了高晓松的声音
文库划重点:AI语音变声技术可以将任何人的声音转化为特定的声音,这是在表征学习当中的一个重要突破。“在远程的直播行业当中,我们遇到有些老师带有口音,而这个技术可以将老师的口音转化为标准的普通话,这将给知识付费的这种远程教育行业,甚至导游行业,带来颠覆。”
与文艺复兴时代,探讨人与人、人与神的关系不同,在智能科技大行其道的当下,人与机器的关系成为更耐人寻味的话题。
当智能手机逐渐取代钱包,当人工智能机器人AlphaGo打败了围棋世界冠军,当商业火箭把电动跑车送上太空……与文艺复兴时代,探讨人与人、人与神的关系不同,在智能科技大行其道的当下,人与机器的关系成为更耐人寻味的话题。
5月24日,搜狗CEO王小川在2019极客公园科技商业峰会上发表了名为《人与机器共创未来》的演讲,探讨“人与机器的关系”。
王小川变“高晓松”?AI语音变声以假乱真
峰会上,王小川现场演绎了由搜狗自主研发的语音变声功能。他用语音变声功能说了一段话,随后,知名音乐人高晓松“复述”了他的话,除了音色不同之外,语音、语调、情感都被完美复制。
王小川介绍,AI语音变声技术可以将任何人的声音转化为特定的声音,这是在表征学习当中的一个重要突破。
界面四川发现,搜狗输入法“变声”功能中设置的“特定音色”非常丰富,涵盖互联网、明星类、动漫等多个类别,除了固定的明星人物和角色,还有大叔音、萝莉音、公子音、御姐音等基础声音。
“这不仅是一件‘好玩’的事情,当我跟网络教育行业进行沟通的时候,整个行业沸腾了。”王小川说。
“在远程的直播行业当中,我们遇到有些老师带有口音,而这个技术可以将老师的口音转化为标准的普通话,这将给知识付费的这种远程教育行业,甚至导游行业,带来颠覆。”
同样,这个技术会给医疗行业带来改变。“医疗整个大环境当中,信息化做得不够,使得整个医疗AI很难实现。在医生与病人沟通时,AI语音变声可以辅助生成病例,实现语音到语言的转换。”
王小川设想,随着AI技术发展,机器越来越准确之后,辅以计算、推理、认知的能力,在医疗领域里做更多的信息处理,能够逐步提供标准答案。最终的形态是个人助理。
什么样的工作会被机器取代?
重要的技术突破,推动着史前文明、农业文明、工业文明、信息文明交叠前进。计算机和互联网技术的发展,催生信息文明的不断向前。2016年,AlphaGo的诞生将人们引入“人与机器关系”的深思考。
什么样的工作会被机器取代?人类是否会被机器取代?
演讲现场,王小川用两个观点阐述了人工智能本身的局限性。“第一,今天人工智能已经具有了强大的感知能力。即跟外界接触之后进行信息低层次处理的感知。目前,机器对于复杂的未曾见过的感知问题还没有办法处理,但是对于见过的场景里已经可以比人做得更好。”
“但在认知领域,机器就会难很多了,尤其是跟语言相关的。”王小川表示,语言是我们对世界的一种抽象认识,同样,机器不具备人类还有迁移学习能力。”
由此,他断言,在认知问题里面机器只能辅助人类,比如说写一部小说或者进行对话时,机器并不能独立工作,但在认知问题、感知问题方面,机器可以独立上岗,就像图像和语音的处理。
人类与机器的未来:协同进化
王小川坦然,语音识别技术应用设备这类智能硬件与“AI助理”的实现之间,还有很长的演化道路。这不是搜狗一个公司能完成的。同样,他认为,人类是否会被机器取代,也是需要长期回答的命题。
他以计算器举例子,“我们不会跟一个计算器比拼计算速度,未来,人工智能在特定领域里的使用,也一定远远超过人。”
在王小川看来,人类通用的智能、生命力、适应环境的能力,在可见的技术里面,机器也是做不到的。首先不要妄自菲薄,人类之所以想机器会把人取代了,因为找不着一个比人更厉害、能完整替代人的机器。王小川表示,人类要去接受机器在很多情况里面能够替代人的部分的功能,或者增强人部分的功能。比如因为眼镜使得我们的视力变得更好,因为手机使我们每个人变成千里眼、顺风耳,技术跟人会产生新的融合,它会改变人。
“未来人跟机器会有一种新的合体,跟技术在一块我们会变得更加强大,形成新的生态,这是人与机器协同进化的未来。”王小川说。
(原文标题:《搜狗CEO王小川谈未来生态:人与机器协同进化》)
收录于哈希力量,手机站省略本文固定网址