一手实测文心X1/4.5:又强又全面!歪果网友疯求英文版

文心一言两周年,百度一口气上新两款模型,并且上来就是一个主题:免费。这个消息一夜间在𝕏(原Twitter)上引来大批歪果网友关注,相当炸裂。画风是酱婶儿的:你们能不能把页面也用英文展示一下?有没有英文/国际版啊?可把玩不上的网友给急坏了。毕竟,这次百度带来的不仅有半个多月前承诺的新一代原生多模态基础大模型文心大模型4.5,能力更全⾯的深度思考模型文心大模型X1也无预告突然同步上线。两款模型现已在

Transformer+Mamba黄金组合!长文推理性能飙升3倍,性能还更强

过去几年,Transformer虽稳坐AI架构「铁王座」,但其二次方复杂度带来的算力消耗和长序列处理瓶颈,限制了大模型在推理阶段处理长文本。Mamba凭借「线性复杂度」异军突起,非常适合长序列任务,有望成为Transformer架构的替代品,但在处理全局关系上偏弱。Mamba+Transformer混合架构可以将二者的优势互补,实现「效率」和「性能」的双丰收。最近英伟达发布了Nemotron-H

实测国内外大模型数学能力:YiXin-Distill-Qwen-72B登顶,半数大厂模型不及格?

数学题, 一直是检验 AI 实力的 “硬核考场” —— 公式推导、逻辑链条、抽象思维缺一不可 。最近,我好了几天时间对国内外 7 款大厂模型展开了一场 “数学高考 ”,用阿里全球数学竞赛 + 中国奥赛真题实测它们的智商上限。参战选手: 国产新星:DeepSeek R1、混元 T1、通义 QwQ、YiXin-Distill-Qwen-72B国际选手:Grok 3 beta、Gemini 2.0

智能体做报告哪家强?Fellou与扣子空间初体验对比

两家新品上市本周国内 AI 智能体市场依旧精彩纷呈,短短几天内多款智能体产品新推出市场,其中尤以Fellou和扣子空间最受关注。有意思的是,虽然这两个智能体产品的架构和定位截然不同,产品团队更有天壤之别,但由于操作界面类似,因此作为像我这样的普通用户而言,在体验前是很难说出两者的区别在什么地方。什么是Fellou?Fellou的定位是「Agentic Browser 行动浏览器」,与大家熟知的I