AI同传的责难与正名,科技文明的进步与挑战
文库划重点:早在2012年,谷歌就曾尝试把翻译系统融入进硬件终端,并为此画下了一个美妙的蓝图,即使用智能手机通话的双方可以各说各的母语,系统将其自动翻译转化为对方的母语,再传输给对方,这宛如科幻电影的一幕令人颇为期待。
以色列历史学家尤瓦尔·赫拉利认为,语言是人类有别于其他动物拥有智慧之名的「最独特功能」,尽管从小到蚂蚁大到鲸鱼的不同物种都具备独特沟通方式,但唯有人类可以通过语言进行虚构、创作、逻辑、想象乃至沉淀思想,最终推动了心智的进化。
而随着科技文明的前行,语言本身所具备的技能属性逐渐消退,新兴技术推进落地下的机器翻译乃至AI同传正走上舞台中央。
早在2012年,谷歌就曾尝试把翻译系统融入进硬件终端,并为此画下了一个美妙的蓝图,即使用智能手机通话的双方可以各说各的母语,系统将其自动翻译转化为对方的母语,再传输给对方,这宛如科幻电影的一幕令人颇为期待。
可惜受限于彼时技术的不够成熟,这项尝试最终以搁浅收场。而近年来AI技术的快速发展再度为上述机器翻译的理想应用场景带来了曙光——去年谷歌以耳机配件的形式发布内置语言翻译应用的Pixel Buds。
然而,正如科幻小说家亚瑟·克拉克所提出的「克拉克第三定律」所说,「任何非常先进的技术,初看都与魔法无异。」
新兴技术在诞生初期往往要遭遇意料之外的挫折,今年9月下旬,科大讯飞被曝出在今年的创新与新兴产业发展国际会议上用人工翻译冒充AI同传,并在没有征得同传工作人员同意的情况下就冒名使用翻译成果。
尽管科大讯飞第一时间出面,以「从始至终都强调人机耦合——而非AI同传——才是机器翻译的未来」为由做出辩解,但依然挡不住舆论哗然,其股价也在此后的一个月里跌去了近三分之一。
而本身难度系数较大,涉及语音识别、机器翻译、语音合成等多项技术挑战的AI同传也因此陷入了业界责难与质疑的境地,「AI同传是否还有未来」这一辩题也再度被摆在了台面之上。
与科大讯飞的遭遇相映成趣的是,日前,搜狗旗下AI同传技术先后登场亮相本月上旬举办的中国网球公开赛、国际马术大师赛,以中英双语实时字幕帮助到场观众顺畅的了解诸如场地接受、选手采访等一系列信息,为观众们消除了共度体育盛会的语言隔阂,极大的优化了观赛体验。
一个更加直观的例子是,在中国网球公开赛上——亦是亚洲最高级别的综合型网球赛事——丹麦选手沃兹尼亚奇时隔8年再度斩获女单冠军,赛后采访中她面对镜头说出「感谢中网,中网是我最喜欢的赛事之一」时,大屏幕上同步展示了中文字幕,精准高效的翻译水准让所有观众秒懂了她的这句话,也瞬间响起了一片欢呼声。
一言以蔽之,搜狗AI同传在成为国内首个为国际赛事提供机器翻译的同传系统之余,也为「科技让世界无距」这一理念做出了又一次展示。
其实,一直以来,搜狗都以「语言」为核心持续推动AI技术的研发和落地,这一方面体现在其在2012年就已立项人工智能,时至今日已经实现在语音识别、语音合成、人机交互等多方面稳居全球领跑阵营。例如,搜狗语音识别拥有超过98%的识别率、每分钟可输入400字以上的国际领先技术水准。
正如上文所说,AI同传工作不仅要求机器能够流畅的记录、翻译内容,还必须能良好的识别词语和句子的停顿,需要覆盖语音断句、语音识别、文本断句、机器翻译等多个技术维度,以此方能实现稳定高效,媲美乃至超越人工同传的临场表现。
这就决定了AI同传始终面对的都是多项AI技术的挑战,对于优化资源整合,打通技术协作的要求更加严苛。
搜狗也正是这样做的,早在其语音识别系统构建之初就写进了搜索引擎的产品底层,每天4亿次语音请求的请求、33万小时的语料构成了机器学习的最佳教材,这最终融入了搜狗的硬件层面——诸如搜狗旅行翻译宝等硬件产品的推出也坐实了搜狗领先的技术落地能力。
而在难度系数更大的AI同传方面,搜狗在技术上的表现并不稍弱于谷歌等科技巨头。例如与谷歌GNMT的八层结构相比,搜狗同传的神经网络精简为五层,提高了自然语言处理和深度学习的效率。
再比如在文本断句这一语音识别和机器翻译之间的最关键环节,搜狗AI同传一方面通过内容平滑技术去掉无意义词语,使句子变得通顺,然后通过规则和模型两种方法进行语句划分并加标点。
另一方面则将语音识别技术和机器翻译技术进行了结合,采用端到端的神经网络翻译技术,通过编码端获取源端句子的分布式表示,利用注意力模型聚焦源端,使用循环神经网络生成翻译结果,最终实现了AI同传翻译结果比传统机器翻译的精准度还要高出30%~40%。
事实上,最近一年以来,搜狗的AI同传技术已经为包括联合国教科文大会、人工智能产业峰会、2018中国大数据应用大会、2018NBI夏季创新峰会在内的上百场大型会议、活动服务过,如今能够站上国际赛事为AI同传正名并不令人感到意外。
作为一项早在半个世纪前就是学术界座上宾的热门议程,AI的发展始终都受限于技术瓶颈,更一度被视为是自动化的延续,直到运算能力及规则突破曾经认为框定的天花板,我们方才能够迎来AI的开花结果。
换言之,科大讯飞在AI同传上所遭遇的挫折或者说碰壁,并不能左右后者的未来。
就像大航海时代的盛况,AI领域已经被视作那黄金资源空前富饶的遥远大陆,尽管剑指这已被科幻文艺提前发扬光大多年的未来世界的野望并无二致,但受限于航线方向、船队规模和支撑势力的各自不同,总会有人无法到达成功的彼岸。
八十多年前,刘易斯·芒福德曾忧心忡忡的告诫社会,警惕这种臣服于精密机器的可能性,「当教徒可以经由《圣经》的印刷品感知上帝的时候,他也就被削弱了前往教堂亲历神父传道的欲望,当电话铃声不受主人约束的随时可以在书房里响起,工作和生活的连贯也就从此变得昂贵起来。」
但正如爱因斯坦所说,「我从不去想未来,因为它来的够快。」
科技革命对于生产力和生产效率的刺激会带来更为充盈和廉价的商品,最终造福于整个社会,相较于哲人们的精神洁癖,这种实实在在的福祉无疑值得期待。
无论如何,AI同传的责难与正名只是科技文明快速发展进程中的一个小插曲,对于包括搜狗在内所有有志于占领AI时代高地的企业而言,不远的未来还有更多挑战值得他们为之奋斗。
收录于哈希力量,手机站省略本文固定网址