AI热点 3月前 240 阅读 0 评论

谷歌Gemini 3.0「全家桶」年度压轴,前端不再需要人类!下周王者降临

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

Sora 2之后,全网都在等待下一个G点的到来!


本月AI大事纪,当属谷歌DeepMind下一代旗舰模型Gemini 3.0「全家桶」的登场。


传闻称,预计10月22日,Gemini 3.0就要出世了!



内部实习生泄露


在此之前,许多开发者纷纷拿到了内测资格,已经放出了一波惊艳demo。


Gemini 3.0在前端开发上,实力惊人,可以一键直出网页。



六边形小球物理测试已不算什么,Gemini 3.0可以在3D六边形测试中,小球运动也能遵循物理定律。



前端编码,或许真的不再需要人类了。




更惊艳的是,网友@ʟᴇɢɪᴛ一句话,就能让Gemini 3.0可以原创钢琴音乐,旋律激昂澎湃。



前端开发,被Gemini 3.0攻陷了


前段时间,内部代码流出,Gemini 3.0「家族」目前有Gemini 3.0 Pro、Gemini 3.0 Flash两个版本。


根据网友实测的模型显示,还有Gemini 3.0 Ultra



目前,gemini-beta-3.0-pro已在最新的Gemini-CLI提交中被引用。



关于模型更多爆料,Gemini 3.0同样采用了MoE架构,超万亿参数,每次查询激活参数为150-200亿参数。


同时,上下文从100万跃升至数百万个token,可以处理整本书、代码库。




网页、游戏,一键直出


从目前内测人士放出的Demo来看,Gemini 3的前端表现能力又得到了巨大提升。


以下是一大波实测案例。



比如生成一张包含第一代起始宝可梦的图鉴SVG。



生成复杂的分形动画。



网友还将同一个提示扔给Gemini 2.5 Pro和Gemini 3.0,后者一次尝试就完成了「太空侵略者」的游戏。




Gemini 3.0在「城堡防御」游戏测试的表现同样出色。



为古代艺术博物馆设计一个网页,Gemini 3.0一次就做到了。




鹈鹕骑自行车3D版



还有人说Gemini 3 Pro创建了这座堡垒!但没有透露具体的Prompts。



测试前端能力最有梗的鹈鹕骑自行车,Gemini 3的表现也是断档的领先。



众多内测人士表示,Gemini 3.0 Pro太神了!


唯一的要求是发布时不要削弱它。



「骑自行车的鹈鹕」,是在旧金山 AI 工程师世博会(AI Engineer World’s Fair)上,Simon Willison自创的图像生成测试,作为回顾过去六个月LLM演进的幽默演讲素材。



在早期的模型表现效果如下所示。



而Gemini 3 Pro甚至可以将「骑自行车的鹈鹕」做成3D版本的像素体艺术。



众多网友表示,3D很难,很难想象模型是怎么做到的。



同一个提示——生成Xbox 360手柄的SVG图像,Gemini 3.0更贴近真实效果。



还有人内测了Gemini 3 Ultra。



使用Gemini 3 Ultra生成了Minecraft风格版本的建筑。


说实话,这真的很难让人相信!



Gemini 3.0 Pro生成的另一个城堡。




Gemini 3.0「发烧梦」


2025年9月,Gemini的环比增长率为46.24%


远高于其他产品,比如ChatGPT、Claude和Grok。



如果本月Gemini 3全家桶正式发布,并且效果远好于预期的话,或许还能让Gemini更上一层楼!



还有网友透露了Gemini 3 Pro的训练细节。


Gemini 3 Pro在今年4月就已经开始训练,预训练在7月左右结束。


然后用了大约2~3个月进行后训练。



还有网友表示,Gemini 2.5已经很老了,今年3月25日以「Experimental」(实验)版本形式首次推出。



在6月17日,Gemini 2.5的Pro和Flash版本进入正式状态。



目前来看,内测泄露的结果可以初步得出,Gemini的视觉能力非常强。


有网友认为,这将对前端开发和UI/UX设计产生较大的影响。



不知,这是不是所有人关于Gemini 3.0的「发烧梦」。



参考资料:


https://x.com/chetaslua/status/1977345755758113110


https://x.com/Lentils80/status/1977441690970476621


https://x.com/ChetasOG/status/1977323656469790951


https://x.com/daniel_mac8/status/1977074729254330863


https://x.com/legit_api/status/1977033715965718754



文章来自于微信公众号 “新智元”,作者 “新智元”

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!