清华大学机器人控制实验室主任赵明国:我教机器人踢足球
文库划重点:若从产业的技术路线看,可以分成三个阶段:第一阶段,解决各种场景中的移动问题;第二阶段,解决简单场景中的移动操作问题,包括讲解、引导、巡检、搬运、装配、整理等;第三阶段,解决复杂场景中的移动操作问题,如适用于养老、工作空间和家庭的服务机器人。
内容提示:文章涉及商业品牌种草植入
赵明国 清华大学自动化系研究员、机器人控制实验室主任,2001年毕业于哈尔滨工业大学,主要从事人形机器人步态控制及无人驾驶自行车的研究。
2024年12月,赵明国在北京接受《环球人物》记者采访。(本刊记者 杨皓 / 摄)
2024年,入行的第二十四个年头,赵明国经历了人形机器人行业“被看见”的时刻。
“成果开始集中体现了。”赵明国告诉《环球人物》记者:“有的人形机器人展示的是行动能力,走路更像人了;有的可以在超市完成各种抓取任务;有的可以远程交互;有的可以叠衣服、刷盘子,甚至在工厂里完成一些操作;等等。”
说这话时,他的身后就站着一个双足人形机器人,身高1.1米,体重20公斤,银黑色系,机械感十足。相较之下,背黑色双肩包、穿米色系带帆布鞋的赵明国则显得低调得多。他是清华大学自动化系研究员、机器人控制实验室主任,主要从事人形机器人的算法开发和设计工作。
所谓人形机器人,是指模仿人的形态和行为而设计制造的机器人。相较一般机器人,人形机器人具有更加复杂的结构、传感、驱动和控制系统,以及类人的感知、决策、行为和交互能力。行内有这么一句话:如果说机器人是“制造业皇冠顶端的明珠”,那么人形机器人则是其中最闪亮的那颗。这个圈子很小,叫得出名字的入局者就那么几家。但今年,赵明国感到,情形变得很不一样。
不只是那些激动人心的成果。向内一步,也是在今年,业内对人形机器人的底层技术逻辑达成了共识。“以前搞人形机器人就是locomotion,也就是运动——如果一个机器人能在各种地形上行走,那么我们就认为这个机器人是高水平的。但今年,大家已经找到一个标准范式——用‘强化学习’,也就是让智能体(Agent)与环境进行交互,根据环境的奖励反馈来调整自己的行为,以获得最大化的奖励。以前我们要花很长时间才能实现的目标,现在很快就能做到,成本也大幅下降。大家都在朝这个方向努力。”赵明国说,这种共识是全球性的,从这个意义上来说,2024年堪称人形机器人行业的转折点。
在新质生产力中,人形机器人是颇为独特的存在——它是多个交叉学科综合作用的结果,是一个国家综合生产力的体现;它还是生产力的载体,类似今天的手机、汽车,“未来很多变革都将发生在人形机器人领域或者通过人形机器人来完成。”赵明国说。
赵明国来自“冰城”哈尔滨,当年因为“离家近”入读了哈尔滨工业大学,出于对物理和计算机的兴趣选择了“机电一体化”专业。1997年,日本本田公司推出了完全独立依靠两条腿行走的机器人P3。同年,时任(此处原文为某领导人)前往本田总部参观,P3走到大厅当中,面对(此处原文为某领导人)站好,伸出右手作欢迎状,并用汉语自我介绍:“我是机器人P3,热烈欢迎(此处原文为某领导人)和夫人光临,请允许我与您握手。”说罢,它握住(此处原文为某领导人)的手,连续摇动了3次。
赵明国回忆:“当时我们搞机器人的老师和学生都在关注P3,说搞机器人的就应该搞这种机器人。”2001年,赵明国加入清华大学,从此走上研究人形机器人的道路。
向《环球人物》记者谈及人形机器人可能带来的改变时,赵明国条理清晰,语调平和。对他而言,那是一个可以预见的世界。
“加速进化”研制的人形机器人在踢足球
从“1V1”到“2V2”
今年12月中旬,在山东淄博举行的一场足球赛火了。
这是一场中国高校机器人足球赛,球员是4个人形机器人,分别来自清华大学和中国农业大学。视频画面中,室内一块几十平方米大的绿地上,当足球向场地中央滚动时,参赛双方各有一名“球员”移动到场边,一方进攻,一方防守;其余两名追着足球走动的“球员”则形成对峙,却又迟迟没有动作,各自对着几十厘米外的足球作原地踏步状。“4个机器人很胶着地抢在了一起。”场外解说道,更为这稍显滑稽的场面增添了几分幽默。
网友们互动很热烈:“像我太爷太奶”“家里不乱的可以买一个回去添乱”“人类真是奇妙,造一个人工智能出来就是为了模仿老年人踢球”……
赵明国也关注到了这些讨论,他是这类比赛的常客。2004年10月和12月,赵明国带领清华大学队在国内两场机器人足球比赛中均获得“四腿组”冠军。此后,他又带领团队连续多年参加了全球级别最高、规模最大、影响力最广泛的机器人赛事之一——RoboCup机器人世界杯人形组比赛,并多次获得亚军。
赵明国告诉《环球人物》记者,这些机器人看似笨拙的步态和迟钝的表现背后,其实蕴含着重要的技术突破和可观的应用前景。
人形机器人的工作机理和真人完全不同。人的大脑可以做许多预处理,供我们高效理解和使用感官系统接收到的原始信息。但对于人形机器人来说,足球、门柱……每捕捉到一帧,就要做一次识别和定位,还要在不确定的概率分布下作出决策。“所以有时它们会做出‘愚笨’的行为,人类会觉得‘这个机器人太搞笑了’。”
2024年8月21日,2024世界机器人大会在北京开幕,许多观众来此参观体验
赵明国提到了今年的一场国际机器人足球比赛。在那场比赛中,其中一方“球员”已经把球踢到了对方的门线上,只需再走过去轻轻一碰就可以进球;更何况此时,对方“球员”已因摔倒在地不能行动而下场,它是场上唯一一名“球员”。
当时,这名“球员”从中场走到球门前,看了球一眼,便转身离去;回到中场后,机器人又开始找球,再次走到球面前后,又转身回到了中场。这样的情形重复5次后,这名“球员”的研发团队终于找到了原因:阴影。
场地上方灯光的照射使得处于门线附近的足球刚好被门柱横梁的投影覆盖。机器人识别不到足球,于是返回中场寻找;而当时正有人站在附近,形成了一片面积更大的阴影,机器人只好“无助地”在场地间穿梭。阴影的问题一解决,机器人很快便将这粒等候多时的进球“收入囊中”。
“其实我们已经实现了一些突破,足球比赛从1V1到2V2,远不止是双方增加了一名‘球员’那么简单。想象一下,在一个球场中,球门的位置在这儿,我可以把球放在场上任何一个位置,对于机器人来说,每个位置对应的识别、判断和决策都不一样。”赵明国解释道:“1V1时,机器人可以不用管队友或对手,只需要踢球;但变为2V2时,除了要考虑球的运动,还涉及与队友、对手的互动。每多一名‘球员’,场上的情况就要复杂好几倍,对应的技术难度就要上一个台阶。”
而赵明国的最终目标,是研制出像人一样,能够在足球场上实现团队协作和对抗的人形机器人,到2050年击败人类世界杯冠军。“概括来说,就是让机器人学会在场上站位、跑位,同时具备控制头的决策能力和控制双足的决策能力,比如有球时怎么办,没球时又怎么办,对方在什么位置我怎么绕,球门在什么位置我怎么踢……这就像训练一名真人足球运动员——你想,训练一个梅西出来有多难?”
既如此,为什么要让机器人踢足球?赵明国说,他看中的是“让机器人踢足球”这项任务背后的能力。
“比如有人研究让机器人搬运货物,这个问题现在看很难,但5年后它可能就被解决了,研究者需要再换一个问题。但我认为‘踢足球’这个问题永远有探索空间,因为踢球的水平可以不断提高——比如现在可以每秒跑1米,5年后我们可以提高到每秒跑5米。我们判断,‘踢足球’至少可以搞到2050年,它对技术的发展和促进可以一直延续下去。踢足球的问题解决到一个阶段后,我们可以把相关的技术转出来,转到其他行业去应用。”赵明国说。而到了那时,今天我们对“机器人时代”的所有想象,或许都是最没有想象力的答案。
事实上,就那些被网友们“调侃”的“球员”而言,当中已经有部分技术实现了迁移。比如用于社区巡检的智能机器人,就可以根据实时环境灵活调整行动策略,一如绿茵场上审时度势的“球员”。
赵明国非常重视人形机器人的应用价值,鼓励学生创业,深入市场。他的学生在2023年创立了一家人形机器人公司——北京加速进化科技有限公司(以下简称“加速进化”),那是接下来的故事。
互动
在赵明国的影响下,“加速进化”可能是“全国甚至全世界唯一一家用‘踢足球’带动机器人技术发展的人形机器人企业”。
公司CEO程昊从小喜欢机器人,毕业于清华大学自动化系,曾是清华大学机器人足球队成员,跟着赵明国参加过几届机器人足球赛。
2022年9月,特斯拉推出人形机器人“擎天柱”(Optimus)的一代原型机,其可以实现直立行走、搬运、洒水等复杂动作。特斯拉称,“擎天柱”将于近年实现量产上市。自此,全球人形机器人赛道被引燃,各大公司纷纷入场。程昊觉得,是时候“回去”了。
赵明国记得,2022年的一天,在互联网“大厂”担任高管的程昊找到自己:“老师,我还是要回到机器人这个行业。”师徒俩一拍即合,程昊辞职创业,第二年6月,“加速进化”成立,致力于研发更富有行动能力的人形机器人本体和易于开发的运控平台。
老师在学校做研究,学生出去创业,从而推动行业发展,这是当前人形机器人领域的普遍做法。“研究好不好用直接就能验证,最关键的是,我们可以知道当下最需要解决的问题是什么。”赵明国回忆,有一次,他的一名研究生向他请教:在实验中发现我们的算法有3个功能,但目前只能优先强化一种,不知道哪一个功能在应用中更重要?
赵明国把这个问题带到了“加速进化”,从工程师那里得到了答案。这个被工程师们选择的功能叫做“抗负载变化”。以端水为例,具备“抗负载变化”功能的机器人在拿起水杯前就可以通过视觉预判杯子重量,并自动将负载重量调整至合适区间——这和真人端水时的行为模式十分接近。与现在只能抓取固定重量的机器人不同,具备“抗负载变化”功能的机器人适应性更强,灵活度更高,在复杂操作中有着非常广泛的应用前景。
“我们经常会冒出来一些新点子,但这个点子未来在实际应用中能否用得上,就需要和一线的工程师们沟通,修正我们的研究。相应地,我们的研究也会有益于他们问题的解决。学术和产业的互动就这么产生了。”赵明国说。
机器人WABOT—1。(图片来源:日本早稻田大学人形机器人研究所官网)
“我自己就能用上”
《环球人物》:您如何理解新质生产力?在您看来,人形机器人将在其中发挥怎样的作用?
赵明国:新质生产力的特征是高科技创新,并具有高效能、高质量的特征,能引起社会的创新发展。人形机器人符合这几点特征,属于新质生产力。
此外,由于人形机器人是多学科交叉的结果,所以发展人形机器人可以带动多个领域的技术革命,形成产业链创新,解决国家和社会发展中很多根本性问题。
《环球人物》:您认为,人形机器人这一行业发展至今,大致经历过哪几个阶段?
赵明国:1973年,世界第一台全尺寸人形智能机器人WABOT—1走出早稻田大学加藤实验室。尽管它行走一步需要45秒,步幅只有10厘米,但它的问世代表人类已初步实现全尺寸人形机器人双足行走。此后30多年间,人形机器人一直在发展,以本田、波士顿动力为代表的公司将人形机器人的运动能力发挥到了极致。但这些技术仅掌握在少数团队手中,实现时间长,实现代价高。
2019年前后,英伟达和苏黎世联邦理工学院等机构在四足机器人上率先验证了先在仿真中应用“强化学习”再迁移到四足机器人上的可操作性,四足机器人的运动能力得到极大提升。2022年以后,许多团队将这一思路应用于人形机器人,取得了非常好的效果。这一技术路线实现时间短、实现代价低,因此近年来,人形机器人的运动能力得到了很大提高。再加上具身智能技术的兴起,使得人形机器人操作能力也得到提升,人形机器人的移动操作成为可能。
2024年11月,葡萄牙里斯本,为物流工作制造的机器人吸引了众多目光
《环球人物》:目前我国人形机器人产业的现状是怎样的?在全球处于什么水平?
赵明国:若从产业的技术路线看,可以分成三个阶段:第一阶段,解决各种场景中的移动问题;第二阶段,解决简单场景中的移动操作问题,包括讲解、引导、巡检、搬运、装配、整理等;第三阶段,解决复杂场景中的移动操作问题,如适用于养老、工作空间和家庭的服务机器人。
目前国内的技术路线适用于第一阶段的教育科研场景,正在尝试第二阶段的To B类(To Business,面向企业用户)应用,即无人工厂、商店和物流等场景的移动操作。当前国内人形机器人的发展基本与全球同步,中美两国位列全球人形机器人领域的第一梯队。
《环球人物》:根据您的研究,人形机器人作为新质生产力,预计将带来多大的产业规模?能在哪些方面造福于人类生活?
赵明国:人形机器人市场潜力巨大。国际投资银行高盛预测,到2035年,人形机器人市场规模有望达到1540亿美元(约合11037.3亿元人民币)。特斯拉CEO马斯克展望,长期来看人形机器人需求量可能高达100亿台。可见,它对中国经济高质量发展具有重要的意义。
未来,人形机器人将具有高效、高敏捷性的移动能力,能够感知复杂的自然环境,并通过智能完成复杂任务,解决中国由于老龄化带来的很多问题。
我现在这个年纪,再搞20年人形机器人,大概70多岁,那时人形机器人我自己就能用上(笑),哪怕端端茶、倒倒水或者做一些简单的服务。人形机器人在养老方面的应用与每个人都息息相关。
另外,人形机器人还能在一定程度上弥补劳动力短缺的问题,比如高空作业、地下勘测等特定场景使用的人形机器人。
现在是移动互联网时代,手机扮演着重要角色;未来,我们学习、生活、工作中的很多事情将通过机器人来实现,那时就是“机器人时代”了。
收录于哈希力量,手机站省略本文固定网址