企业综述 | 人形机器人何时能进入千家万户?
文库划重点:1950年,图灵在其论文《ComputingMachineryandIntelligence》中首次提出了具身智能的概念......因为像人,所以人形机器人可以适应人类的生活环境,比如通过灵巧的手来开门、端茶送水,通过双足来走路、上下楼梯、爬坡等。
20世纪中叶,科幻作品中大量出现“仿人机器人”的形象,形塑了人们对于机器人的想象。这种机器人往往被设计为与人类尺寸相当,且拥有四肢、躯干、头部甚至五官。如今,科幻故事正在逐步变成现实。
北京时间5月17日凌晨,在2023年股东大会上,特斯拉人形机器人Optimus再秀新技能,基于AI模仿人类动作,并完成物品分类等复杂任务。
人形机器人,又称仿生人,特指外形模仿人类外观和行为的机器人。此前,人形机器人的概念还主要停留在科学幻想领域,随着技术发展,很多科技公司争相进入人形机器人领域。
今年,ChatGPT引发的AI大模型热潮,更是为人形机器人的发展注入了新生机。
中信证券研究认为,机器人是AI技术的重要载体之一。ChatGPT与机器人的结合,将弥补当前机器人在智能性、易用性、经济性上的短板,有效提升机器人在各个行业的渗透率。同时,ChatGPT也将缩短机器人从单一功能的专用机器人向复杂多功能的通用机器人发展的过渡时间。
争相布局人形机器人赛道
人形机器人被誉为机器人皇冠上的明珠,在所有机器人的研发中,其挑战难度最高。从去年开始,国内科技厂商如小米、达闼便在服务机器人产业方面有所布局,推出人形机器人产品“铁大”“一行”等。
随着ChatGPT的应用逐渐深入,自今年以来,企业对AI+机器人的布局再度火热。
今年2月,微软团队披露正在探索如何将ChatGPT扩展到机器人领域,旨在让人类用自然语言控制机器人等硬件平台。
3月,谷歌推出史上最大的视觉语言模型一PaLM-E,将目光投向了家庭自动化和工业机器人的场景;ChatGPT研发公司OpenAl领投挪威人形机器人公司1XTechnologies(前称为Halodi Robotics)。
4月,腾讯Robotics X实验室公布最新机器人研究进展,首次展示在灵巧操作领域的成果,推出自研机器人灵巧手(TRX-Hand)和机械臂(TRX-Arm);北京小米机器人技术有限公司成立,经营范围包含:智能机器人的研发、人工智能行业应用系统集成服务等;在第六届数字中国建设峰会上,阿里巴巴董事会主席兼CEO张勇透露,阿里云工程师正在实验将千问大模型接入工业机器人,在钉钉对话框输入一句人类语言,即可远程指挥机器人工作,并于当天发布演示视频。
5月,在特斯拉2023股东大会上,特斯拉首席执行官埃隆·马斯克展示了与车同源的人形机器人Optimus的全新型号。据介绍,人形机器人的电机、控制器、电子器件以及能在机器人上看到的所有部件,均由特斯拉自主设计。
AI让机器人有了大脑
1950年,图灵在其论文《ComputingMachinery and Intelligence》中首次提出了具身智能的概念。在之后的几十年里,囿于技术问题,具身智能并没有取得突出进展。
自2021年发布以来,马斯克一直为其人形机器人“站台”,不断重申“机器人+AI”的远大前景。从使用场景来看,马斯克对特斯拉机器人的远景目标是让机器人适应环境并能做人类所做之事,进而服务于万千家庭,比如做饭、修剪草坪、照顾老人等。
据了解,具身智能的实现离不开三大环节,分别是感知、想象和执行,这要求人形机器人需要有灵活的头脑、强大的执行力、流畅的与人交流的能力以及像人一样的自学能力。
“多模态大模型与通用机器人平台进行物理交互,再加上场景支持和数据反馈调优,这可能是大模型与机器人结合的发展路径。”在近期公开演讲中,谈及通用AI与人形机器人的相互关系时,优必选副总裁付春江认为,人形机器人赋予通用AI物理实体,使其成为超文本的存在,具备与物理世界交互的能力,从而产生劳动价值和情感价值。
值得留意的是,在去年,人形机器人不够人工智能还是行业待解的难点。
据《财经国家周刊》报道,商汤科技彼时提供的一组数据显示,人类每人每天平均会接触600多个物体,如果把人换成人工智能模型,则其模型训练至少需要处理3500万种可能的场景,而现实是,并没有哪一家企业或研究机构拥有能够覆盖如此多场景的人工智能模型。
“人形机器人要尽可能模拟人在各类场景下‘感知-认知-决策-执行’的过程,但现阶段人形机器人在复杂场景下,机器视觉容易失败,人工智能还‘不够智能’。”当时中科院重庆绿色智能技术研究院人工智能与服务机器人控制技术重点实验室主任何国田也说道,这是下一步科研机构及企业需要攻关之处。
AI大模型开始让机器人真正有了大脑,并可以执行一些需要随机应变的任务。
据了解,在机器人开发阶段,大模型可自动生成代码指令协助工程师完成机器人功能的开发与调试,甚至还能为机器人创造一些全新的功能。
在生产运行阶段,大模型为机器人执行任务提供推理决策的能力,前者将指令自动翻译成机器可以理解的代码,从而指挥机器执行任务、提升生产效率。这其中包括利用机器视觉、深度学习、强化学习等多种AI技术优化软件与算法;利用文本、视觉、语音、场景等跨越不同环境的大量数据集进行训练等。
人形机器人何时进入千家万户?
中国信通院云计算与大数据研究所所长何宝宏认为,以ChatGPT为代表的AIGC技术,将促进AI产业迎来拐点,进一步带动生产力变革。ChatGPT背后的大模型技术及应用范式,将会极大冲击现有人工智能产业研发路线,发展方式或将迎来新拐点。
IDC报告预测,2025年全球AI市场规模将达到2218.7亿美元,其中,中国约占全球总规模的8.3%,即超过184亿美元(约合人民币1271亿元)。
当然,对于普通人来说,对此不免产生疑问,人形机器人为什么要像人,它又能给我们的生活带来哪些具体且实质的影响?
有分析认为,和其他机器人相比,人形机器人因为外观像人类,使得它在与人交互的时候更容易被人接受,并能深入到人类生活的各个方面。此外,因为像人,所以人形机器人可以适应人类的生活环境,比如通过灵巧的手来开门、端茶送水,通过双足来走路、上下楼梯、爬坡等。
“因为人类社会是基于拥有两条手臂和十个手指的双足人形的互动而形成的,因此,如果我们想让机器人适应环境并能做人类所做之事,它就得拥有与人类大致相同的尺寸、形状和能力。”
谈及特斯拉研究人形机器人的原因时,马斯克曾表达过相似观点,他还表示,“我们希望Optimus可以替代人完成一些无聊、重复的,甚至是危险的工作,这些工作是人不想做的,这才是我们研发Optimus的目的。”
细化到更具体的场景,上海人工智能研究院智慧医疗中心首席科学家闫维新表示,强人工智能与机器人本体的结合,将使得机器人走进我们的生活,家政,护理等领域可能较早得到应用。
据了解,在医疗领域,人形机器人可以被用于手术操作、康复训练等;在教育领域和娱乐领域都有应用空间,人形机器人不仅可以被用于辅助教学、协助学生完成各种任务等,还可以被用于演唱会、电影拍摄等。
不过,优必选科技CTO熊友军在接受媒体采访时坦言,人形机器人在发展过程中也存在一定的困难:一是成本偏高,这是阻碍人形机器人进一步走入普通大众生活中的重要原因;二是技术有待提升,人形机器人技术的发展和普通大众对它的期望之间还有很大差距,比如要提升运动能力就需要有好的元器件、传感器等,这都会增加成本;三是整个产业处于早期发展阶段,还需要政策上的支持,以及更多的公司、科研机构加入进来,一起让产业和生态更加繁荣。
今年1月,工信部等十七部门印发《“机器人+”应用行动实施方案》,指出到2025年,制造业机器人密度较2020年实现翻番,服务机器人、特种机器人行业应用深度和广度显著提升。同时,聚焦10大应用重点领域,突破100种以上机器人创新应用技术及解决方案,推广200个以上具有较高技术水平、创新应用模式和显著应用成效的机器人典型应用场景,打造一批“机器人+”应用标杆企业。
日前,北京市还发布了《北京市促进通用人工智能创新发展的若干措施(2023-2025年)(征求意见稿)》,提出探索具身智能、通用智能体和类脑智能等通用人工智能新路径,包括推动具身智能系统研究及应用,突破机器人在开放环境、泛化场景、连续任务等复杂条件下的感知、认知、决策技术。
从相关政策逐渐清晰,到科技企业陆续加入,人形机器人进入千家万户的时长,似乎缩短了一些。(编辑:靖程)
收录于哈希力量,手机站省略本文固定网址