AI热点 8小时前 181 阅读 0 评论

马斯克的Grok 2开源了,但好像又没完全开

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

智东西8月25日消息,昨天,马斯克在海外社交媒体X平台上官宣:Grok 2正式开源,Grok 3半年后开源。

不知是不是笔误,马斯克在推文中写的是Grok 2.5,但开源的其实是Grok 2。 

▲马斯克官宣推文(来源:X)

Grok 2开源了其模型权重文件,总共有500GB,已上线Hugging Face: 

https://huggingface.co/xai-org/grok-2 

▲Grok 2 Hugging Face主页(来源:Hugging Face)

目前,Grok 2在Hugging Face趋势榜排第3名,被Qwen Image Edit和DeepSeek V3.1两个中国的开源模型压过一头。 

▲Hugging Face趋势榜(来源:Hugging Face)

Grok 2是xAI去年8月13日推出的大模型,相较前代产品,Grok 2在响应直觉性、指令遵循性和多任务适应性方面全面提升。当时马斯克曾许下承诺,每当创建Grok新版本的时候,就会开源之前的一个版本。 

今年7月,最新的Grok 4模型正式发布,Grok 2的开源虽迟但到。 

01.开源Grok 2不得用于训练AI模型

与众不同的是,Grok-2没有采用Apache 2.0许可证(Grok-1采用的是该许可证),其采用的是名为Grok 2社区许可协议的许可证,该许可证并非行业通用的开源许可证。 

根据Grok 2社区许可协议规定,该模型仅用于非商业和研究目的,在同意xAI可接受商业政策时才允许用于商业用途。 

并且,(开发者)不得使用该模型来训练、创建或改进任何基础、大型语言或通用AI模型,但可以根据许可条例进行修改和微调。 

如若分发材料、衍生物或包含该等内容的产品/服务,(开发者)需要在相关材料或界面显著标注“由xAI驱动”。 

02.Elo跌至第68名,Arena综合榜单跌至第75名

这个已经推出一年了的模型,如今性能上还能打吗? 

在Grok 2推出之际,LMSYS排行榜数据显示,该模型在综合Elo等级分方面已超越Claude与GPT-4系列模型。 

▲去年Grok 2发布时公布的Elo等级分排名(来源:xAI)

如今,在最新的综合Elo等级分榜单上,Grok 2以1306分跌落至第68名,最新推出的Grok 4以1433分排在第二名,仅次于Gemini 2.5 Pro。 

▲最新综合Elo等级分榜单,截止到8月21日(来源:OpenLM)

在Arena综合榜单上,Grok 2已经跌落至第75名,最新推出的Grok 4排在第12名。 

▲Arena综合榜单(来源:Lmarena)

03.结语:Grok 2开源营销意义或大于实用价值

一年的时间,足以让AI大模型市场格局大洗牌。 

相对于今年新推出的开源模型,Grok 2的性能并没有那么亮眼,且其开源协议的诸多限制也给开发者们使用Grok 2造成了重重阻碍。 

马斯克选择在这个时候开源Grok 2,猜测原因有两点:一是为了兑现此前所承诺的“发布新版本就开源老版本”的承诺,二是给Grok 3的开源制造话题,保持Grok系列模型在公众视野的活跃度。 

本文来自微信公众号 “智东西”(ID:zhidxcom),作者:王 涵,36氪经授权发布。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!