AI热点 2小时前 98 阅读 0 评论

机器狗腿被锯了也能继续走!最新机器人大脑来自320亿估值独角兽

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

不怕故障的机器人大脑来了!


肢体断裂?马达卡住?通通没问题。

只要机器人身体能动,这个大脑就能让它动起来。


踩高跷?适应外力?负载重物?也是so easy。



除此之外,它还能完成更精细的动作,比如放置碗碟。


这个大脑,就是估值已达45亿美元(截至今年6月)的Skild AI新推出的Skild Brain,它在一个包含十万种机器人姿态的虚拟环境中,训练了相当于一千年的时间才得以成型。


更值得一提的是,此模型从未在这些机器人上进行过训练,它对它们的控制能力完全是涌现出来的。


下面具体来看。


只要机器人能动,大脑就能让它动


由于生活中总有很多事情是难以预料的,所以即使很多机器人在视频中表现惊人,但在现实生活中却不可避免要面临失败。


为什么会这样呢?


答案就在于机器人的编程方式。


以机器人的运动为例,大多数控制器都是针对特定机器人训练的,控制它的AI会记住该机器人的运动策略,就像是记住了考试答案一样,对通过考试有用,但对学习如何得出答案却毫无帮助。


当AI面临从未见过的情况,例如马达卡住、肢体断裂或者是全新的身体时,记住的方案就毫无用处。


Skild AI是如何解决的呢?


他们设计了一个AI无法作弊的“测试”,让其不仅学习控制一台机器人,而是训练它去控制一个拥有不同身体形态的机器人多元宇宙


这时,它就无法为某一台机器人记住固定的解决方案,而是要找到适用于所有机器人的通用策略。


基于上述思想,Skild AI创造了一个包含十万台不同机器人的宇宙。在经过一千年的模拟时间后,系统涌现出了一个能够适应陌生场景的大脑。


这个大脑可以在面对陌生场景时快速匹配十万种身体中的任意一种。


比如把一台四足机器人放置在直立位置,并启动它的大脑。大脑被唤醒时,完全不知道自己控制的是什么身体。


出乎意料的是,它竟然决定将这台机器人当作一个小型人形来控制,而不是四足机器人。


但由于普通的人形机器人有踝关节马达和宽大的双脚来保持稳定,这个被限制前腿的四足机器人腿部只有一个被动旋钮,与地面只有一个接触点。


所以这个新大脑必须在极短时间内判断出身体类型并稳定姿态。但由于时间太短,机器人还是摔倒了。


这难道就是大脑的极限了吗?当然不可能。新大脑还能从失败中进行上下文学习,即使机器人在第一次和第二次尝试时都失败了,但在第三次获得了成功。


这就得提提Skild Brain非凡的记忆力了,大多数机器人的控制策略内存都只有几百毫秒,但是这个新大脑的上下文窗口比前者长了100多倍


此外,团队还尝试将机器人的大小腿绑在一起,以模拟其失去肢体的情况。


这一操作不仅缩短了机器人的肢体长度,还让其减少四个自由度。起初,机器人并没有办法进行有效移动,只能十分吃力的原地踏步。


然而,在经过7-8秒的适应后,新大脑发现大幅度摆动大腿关节可克服困境,最终成功实现了有效行走。与此同时,仅针对单一机器人训练的专用控制器则彻底失败,甚至翻倒。


不仅如此,团队还通过在软件中锁定机器人膝盖来模拟关节故障,这会使四足机器人变成三足机器人,而此前它并未接受过这种训练。


最开始,机器人会向前倾斜,但后来它学会了将重心向后转移到三条腿上,甚至在适应2-3秒后就能行走。此类行为同样也发生在轮式四足机器人身上。


那如果突然把机器人的轮子卡住呢?


这个大脑会感知到发送给车轮的指令不再使机器人前进,随后,它会切换到类似标准双足机器人的行走步态,当车轮再次解锁时,大脑会重新切换回更高效的滚动模式。


为了更有效地测试机器人面对不同情况时的平衡状况,团队还给其腿部安装了额外的支柱,也就是让机器人踩高跷。


可以看出,刚开始机器人迈出的几步很不稳定,但其很快就能调整步频和脚的位置,以适应更长的腿部。


Skild AI认为,未来在物理世界中能实现可靠运行的AGI绝不是仅仅依靠记忆,它必须具备适应世界的能力,而实现这一目标的途径就是训练一个可以控制所有身体的“大脑”。


Skild AI公司介绍


Skild AI创立于2023年,旨在开发适用于不同硬件和任务的自适应AI大脑,拥有约6名员工,总部位于宾夕法尼亚州匹兹堡,共有Deepak Pathak和Abhinav Gupta两位创始人



Deepak Pathak,本科就读于印度理工学院坎普尔分校,博士毕业于加州大学伯克利分校,随后继续在该学校从事博士后研究。曾在Meta担任了一年的研究员,现任卡内基梅隆大学计算机科学学院助理教授。



在学术方面,他的总被引次数已超2.7w,h-index为52,i10-index达92。



另一位创始人Abhinav Gupta,本科也就读于印度理工学院坎普尔分校,博士毕业于马里兰大学,随后在卡内基梅隆大学担任博士后研究员,现为该学校教授。


他还曾在谷歌担任过两年计算机视觉和大规模视觉学习项目的教师顾问,后在Meta担任过四年的研究经理兼组长,在多个领域取得了若干关键创新,包括自监督学习、触觉感知、机器人导航和操作等。



Abhinav Gupta的论文总被引次数已超8万,h-index为117,i10-index达323。


自2023年成立以来,Skild AI除了完成1450万美元的种子轮融资外,还完成了A、B两轮融资,共筹集4.14亿美元,确立了其在人工智能机器人创新领域的领先地位。


2024年7月,Skild AI完成A轮融资3亿美元,资金将用于扩展Skild的机器人AI基础模型、扩充团队规模以及推进产品开发,当时,该公司的估值已达15亿美元。


今年6月,Skild AI融资1亿美元,旨在支持公司的市场扩张,并建立战略合作伙伴关系,以加速其物理AI机器人平台的部署。此轮融资使Skild的估值达到45亿美元


除此之外,Skild AI的主要投资者也可圈可点,包括但不限于软银、光速创投、英伟达、三星、红杉资本、亚马逊、卡内基梅隆大学和凯迪拉克等。


参考链接:
[1]https://x.com/SkildAI/status/1970940614234771579
[2]https://www.skild.ai/blogs/omni-bodied
[3]https://exa.ai/websets/directory/skild-funding?utm_source=chatgpt.com


文章来自于微信公众号 “量子位”,作者 “量子位”

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!