机器人必须是「人形」吗?
2025年,被称为“具身智能元年”,甚至就连政府工作报告中都出现了 “具身智能”和“智能机器人”。
最让普通人有所感知的是,大量机器人开始刷屏社交平台:从宇树机器人一套行云流水的拳法耍得有模有样;再到众擎机器人在深圳湾与跑者同框竞跑……
越来越多机器人出现在大众的视野里,用身体力行引爆了背后企业的市值与融资。
但有一个问题一直困扰着我:
为什么所有机器人都是人形的呢?
具身智能的最终方向
大众的“机器人幻想”都是源自于好莱坞,不论是斯皮尔伯格还是詹姆斯卡梅隆,总是对于机器人都有一种特别的“癖好”,在他们眼里机器人并不是冷冰冰的金属躯壳,而是有血有肉的生灵:
它们不知疲倦、时刻求进步、有着比人类更专注的感情、永远在思考着‘我是谁、我从哪里来、我到哪里去’的哲学问题。
于是,不论是T-800终结者,还是银翼杀手,它们都是有手有脚、直立行走的类人形态。
在电影的影响下,几乎所有人都开始觉得,机器人首先要长得像人,起码要会两条腿走路。
在具身智能赛道里,人形机器人也是最璀璨的王冠。
因为物理世界里,人类活动是一个复杂、多元的集合,几乎所有领域的设施和工具都是以人类使用为基础建造的。
人类一直渴望着机器人能代替我们劳动,那也只有将机器人设置成人形,它才能最大程度适应物理世界,而我们不需要改造世界来适应机器人。
滚轮和履带的确比双腿速度更快,但遇到台阶怎么办呢?
四足的确比两足站得稳固,但缺少了“手”的操作,就没办法胜任人类想要它完成的工作。
所以只有把机器人设计成人的样子、拥有人的运动能力,机器人才能更好地适应环境、驾驭更多工具,从而真正具备通用性。
宇树unitree G1
马斯克说,在2040年地球上要有100亿台人形机器人。
那个时候,就需要机器人走进各种工位,进入各种环境去工作。也只有人形机器人可以满足人类社会的楼梯、门把手、工具、家具、开关等等一切工具。
OpenAI总裁格雷格·布罗克曼给了一个更“神棍”的解读。
他认为以后的机器人全部都是“通用人形”的形态,因为人类的基因里面希望自己成为神,希望自己创造出人形态的物种。
不论是现实的物理世界,还是形而上的哲学世界,都有不同的解读视角。
但对于我来说,人体本来就是自然界数十亿年进化后的最优生物形态,为什么要创新?能创新得更好吗?
所以,人形机器人就是具身智能的最终方向。
漫长的人形进化史
科技幻想归科技幻想,但实际开发出一台人形机器人,那可真不容易。
人类想要攻克人形机器人已经有接近60年的时间,直到2025年,才真正算的上“人形机器人元年”。
世界上最早的人形机器人是来自日本,那是1967年,日本早稻田大学研发出了世界上第一款人形机器人WABOT-1的WL-5号两足步行机。
WABOT-1 WL-5号
虽然现在看,它非常的“简陋”,全身只有26个关节,到处都是金属架,行动能力只有一岁婴儿的水准。往前走10公分左右的距离,就需要三个人来操作,花费45秒的时间。
但这已经是“人形机器人·初号机”了。
随后的日子里,受限于人类社会的科技进度,过于复杂的人形机器人逐渐被遗忘。机器人企业转而去研究结构更简单、操作更便利的四足机器人和履带机器人。
毕竟四足和履带站得“更稳”,重心更容易保持在支撑面内。而人形机器人属于双足机器人,支撑面积更小,重心一旦超出支撑面,很容易摔倒。
人形机器人这一停滞,就是足足40多年的时间。
直到1992年波士顿动力实验室诞生的双足机器人,在特制跑步机上,颤抖着迈出第一步,成了人形机器人历史上的一大步。
十年之后,2013年,波士顿动力Atlas人形机器人首次向公众亮相,才顺利解锁了“直立行走”这一技巧,震惊全球。
后来Atlas人形机器人甚至还学会了翻跟头、跳舞。
但是,Atlas至今未能进入商用阶段,原因就是人形机器人完全无法胜任工作场景,只能作为一个“昂贵的玩具”,象征意义大于实际意义。
波士顿动力
从1967年开始,人形机器人一直在尝试寻找它的“大脑”,让它能够更聪明一些更科技一些。直至2023年,它才得偿所愿。
2023年,ChatGPT点燃了“人工智能”的火焰,让整个世界陷入到AI浪潮之中。
机器人企业也异常兴奋,人形机器人终于找到了真正智能的“AI大脑”。
嵌入大模型交互后,机器人的感知、决策和行动能力提升,能够开始理解和执行人类需求。
投喂大量数据后,AI大模型不断迭代能够持续学习,人形机器人就可能具备作业能力。
人形机器人,终于开始有人样了。
大脑、小脑和本体
找到“AI大脑”后,人形机器人进步的速度可以说是一日千里。
2024年,OpenAI亲自下场与机器人创企Figure合作,发布一款内置ChatGPT-4的Figure 01人形机器人,成为世界上第一个拿起苹果的机器人。
2025年,一群在春晚舞台扭着秧歌的“秧Bot”彻底满足了人类对于机器人的认知,也让宇树成为炙手可热的资本宠儿。
是的,人形机器人火了。
在过去一年的时间里,具身智能赛道是资本最火热的一个。融资金额高达119.15亿元,共计发生188起投融资事件。
宇树、众擎、云深处、傅利叶、智元等大量机器人企业坐在风口,扶摇直上。
宇树机器人扭秧歌
市场火热就意味着产品更复杂了。
在2025年,人形机器人又开始进一步细分。将“AI大脑”拆解成三个部分:大脑、小脑和本体。
所谓大脑,指的是机器人的理解能力,也就是机器人对于人类指令的理解以及环境感知;
小脑,是指机器人的精细化运动控制能力;
本体,则是构成人形机器人原型的各类零部件,比如关节、四肢、头等。
此外还需要机器人专用的通用AI、视觉传感器、触觉传感器、力觉传感器等等一系列错综复杂的零部件。
显然,距离人类通往人形机器人的门槛还有很多。
但是量变总终会引发质变,距离下一个人形机器人的技术奇点,相信不会太远。(孙鹏越)
谷歌前CEO:AI性能将继续高速增长,潜在威胁不容忽视11月18日消息,近期有传言称包括OpenAI、谷歌和Anthropic在内的顶级AI实验室在开发先进的AI模型方面遇到了困难。这些报道将原因归咎于缺乏高质量的训练数据,导致收益递减,进而使得继续投资变得困难。对此,OpenAIC...
2023美图创造力大会开幕,美图发布AI视觉大模型4.012月5-6日,主题为“未来AI设计”的美图创造力大会(MeituCreativityConference,简称MCC)在厦门举行。本届大会由美图公司与站酷联合举办,聚焦于设计师生态和AI设计趋势。大会现场发布《2023年度AI设计实践报告》...
好莱坞罢工未停,96%的娱乐公司高层计划砸钱用AI替代人力自今年5月开始,美国编剧工会与资方在薪资等问题上持续罢工近100多天。本次大罢工,也与AI可能取代创作人员有关。然而,罢工问题还未解决,好莱坞96%娱乐公司倒先加大对生成性AI的支出,想用AI替代人力。AI能利用现...
谷歌发布 AI 图像生成新工具 Whisk,支持上传多张图片以图生图IT之家12月17日消息,谷歌今日发布了一款名为Whisk的全新AI图像生成工具,该工具允许用户使用其他图像作为提示来生成图像,而不需要冗长的文本提示。用户只需提供图像,即可指定AI生成图像的主题、场景和风格。使用W...
大佬说AI|百度沈抖、澜舟周明谈大模型落地 国内掀大模型开源热4月1日消息,过去一周,国内外AI圈子又有众多话题涌现。关于大模型的落地,成为AI大佬们热衷谈论的主题之一。近期,国内又有多个大模型及相关产品开源,开源生态建设,也成为AI大佬们关注的重点之一。谈大模型落地百...
如何选购kawai电钢琴??2023年kawai选购攻略大全来了!
哈喽!最近有超多小伙伴问我:怎么选一台kawai性价比高的电钢琴?为了解决大家在选择kawai电钢的困惑,我专门...
苹果招募生成式AI人才 提供数十个大模型岗位
根据最新的招聘信息,苹果正在扩大其生成式人工智能领域的专业团队,并计划将这项技术应用于iPhone和iPad等...
昆仑万维旗下Opera生成式AI服务海外用户数突破100万
昆仑万维旗下Opera宣布,生成式AI服务Aria海外用户数突破100万。2023年5月24日,Opera正式推出生成式AI助理...
创始人王慧文退出 美团成AI公司光年之外唯一股东
8月7日消息,据国家企业信用信息公示系统显示,北京光年之外科技有限公司在近期完成工商变更,创始人王慧文...