AI热点 2小时前 200 阅读 0 评论

刚刚,Gemini「灵魂人物」官宣加盟xAI!马斯克火速转推背书

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章


Gemini核心开发者Dustin Tran,昨天官宣从谷歌DeepMind跳槽到xAI,研发新一代Grok!


马斯克也于第一时间转发推文,确认了这位新同事的加盟xAI消息属实:



从官宣中得知,Dustin Tran已经加入xAI至少几周了,参与了Grok 4 Fast的开发,但直到今天才修改自己的对外头衔介绍,甚至慢于马斯克转发推文。


这也被眼尖的网友发现并调侃了:



Dustin Tran的新同事,xAI创始成员,同时也是之前从谷歌DeepMind跳槽过来的Toby Pohlen,也于第一时间转发推文欢迎新同事:



也有网友关心竞业条款带来的限制:



加州禁止竞业条款,得以让人才能在公司间自由流动,这也被普遍认为是加州的创新活力源泉的重要保障。


Dustin Tran,Gemini核心开发者


Dustin Tran,是Gemini从诞生之初到最新模型的核心开发者。





2014年,他毕业于加州大学伯克利分校,取得数学与统计本科学位,随后进入哈佛大学攻读统计学博士学位,两年后又转入哥伦比亚大学攻读计算机科学博士,并于2018年取得了博士学位。



他目前的论文总引用量已超过2.4万。



他也在读博期间斩获了包括谷歌博士奖学金在内的多项大奖:



他的工作履历相当简洁:2017年在OpenAI研究岗实习,同一年进入谷歌大脑研究岗实习并留任长达8年。



在官宣离职的长推文中,他饱含深情地回顾了在谷歌的8年工作,从混沌中摸索出霸榜的Gemini的心路历程,以及因为xAI的海量算力而选择加入xAI:



我正式告别谷歌DeepMind,结束了8年的旅程。这一路有满满的美好回忆——从最早在谷歌大脑参与一些奠基性的论文(和 @noamshazeer、@ashvaswani、@lukaszkaiser 一起做 Image Transformer、Tensor2Tensor、Mesh TensorFlow),到后来负责Gemini的后训练评测,在100天内追赶并上线;接着带领团队实现跃升,拿下LMArena第一(并稳居榜首一年多!);最后还参与了Gemini在IMO和ICPC上斩获金牌的推理创新(和 @HengTze、@quocleix 一起)。


Gemini的旅程跌宕起伏,不断经历范式的转变:最初,我们改造了LaMDA模型(第一个类指令式的聊天机器人!),让它从单纯的聊天机器人进化为能通过RLHF给出更长、更有内容的回答;之后,我们探索通过长链条思维训练、新颖环境和奖励头来增强推理和深度思考能力。刚开始时,外界普遍并不看好,很多人觉得谷歌会因为搜索的历史包袱和内部政治而注定失败。但如今,Gemini不仅在用户偏好上长期稳居第一,还不断推动新的科学突破,大家反而觉得谷歌赢是理所当然的 😂。(以前每次谷歌有新成果时,OpenAI 总会靠积压的想法先一步发布,从而抢占 AI 的新闻周期;但可以说,他们的「库存」如今已经耗尽了。)


之后我加入了xAI。秘诀其实很清楚:算力、数据,以及大约 O(100) 个聪明又拼命努力的人,这就是拿下前沿级大语言模型所需的一切。xAI对此 真的 深信不疑。在算力方面,即使在谷歌,我也从没见过这种「人均芯片」的规模(而且Colossus 2上还有10 万+的GB200/30 万+的GB300即将到来)。在数据方面,Grok 4做出了RL和后训练规模化的最大押注。xAI现在则在数据扩展、深度思考和训练配方上下注。团队行动也极其迅速——在这么短的时间里,没有任何一家公司能在AI能力上达到 xAI 现在的水平。正如@elonmusk 所说,一家公司的一阶和二阶导数才是最关键的:xAI的发展势头是最快的。


我很兴奋地宣布,在加入的头几周,我们就推出了Grok 4 Fast。Grok 4是一个出色的推理模型,依然在ARC-AGI和新基准(如 FinSearchComp)上排名第一。但它运行较慢,本来也不是面向通用用户需求的。而Grok 4 Fast则是最好的轻量级模型之一——在LMArena上排名第 8(Gemini 2.5 Flash是第 18!),在核心推理评测(如 AIME)上,它能与Grok 4比肩,同时成本却低15倍。特别感谢 @LiTianleli、@jinyilll、@ag_i_2211、@s_tworkowski、@keirp1、@yuhu_ai_。


Gemini如今取得如此亮眼的成绩,也让我们对Dustin Tran能为Grok 5带来的惊喜多了一份期待。


Colossus 2的海量算力


召唤一个强大的Grok 5


我们在此前的文章中,也对马斯克在紧锣密鼓地建设中的Colossus 2进行了详细剖析:马斯克狂烧14万亿,5000万H100算力五年上线!终极爆冲数十亿



Colossus 2的海量算力,体现着马斯克毫不掩饰的野心:实现AGI乃至ASI,是Grok 5乃至xAI更后面的模型要追求的目标。


马斯克作为世界首富,要用天文数字般的算力,让所有对手望而却步。


最顶级的算力,吸引了最顶级的人才。


建设断档式强大AI的所有生产要素,马斯克一样也不想落下。


让我们拭目以待,Dustin Tran的加盟,能为我们带来多么强大的Grok 5。


参考资料:


https://dustintran.com/


https://x.com/dustinvtran/status/1969183617881686405



文章来自于微信公众号 “新智元”,作者 “新智元”

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!