AI大模型权威评测:豆包中文对话最强,OpenAI o1推理和数学占优
国产AI模型多点开花。还有不到一周就2025年了,各大社交音娱平台相继自动弹出“年度报告”的搜索选项。身处AI元年,AI模型这份年终答卷,自然也少不了。 智东西12月25日报道,智源研究院12月19日发布了FlagEval“百模”评测结果,今年国产大模型与海外大模型战况焦灼。 在其闭源大模型评测能力总榜中,字节跳动的豆包通用模型pro拿到主观评测最高分,OpenAI的o1-mini拿到客观评测最
J1 Assistant 新鲜上手体验,熟悉的罗永浩,熟悉的 AI 锤科味儿?
1月5日,罗永浩旗下的 AI 初创项目悄悄在海外上线,我们也在第一时间上手体验了这款产品,为大家带来最“热乎”的产品体验。J1 Assistant 图源:不客观实验室官网:https://matter.ai/ 需要科学上网方可访问,目前的 Beta 版仅支持 Android 手机下载。需要注意的是,目前软件在点开后需要登陆并绑定手机,但国内手机号码无法正常获得验证码,想要正常使用这款软件,你需
全网首发!实测全球首个 AI 程序员 Devin,月薪3500的全能实习生?
省流版:Devin 是一种全新的 AI 编程,他和 Cursor 还有 Windsurf 的区别在于,Devin 不需要你来操作,你只需要告诉他要做什么。你是 CTO/开发组长! 大家还记得今年三月横空出世的 AI 项目 Devin 吗?它当时可是火遍全网,原因就是它自诩为“全球首个 AI 软件工程师”。这下可炸开了锅,大家纷纷好奇:AI 程序员到底有多厉害?会不会也像人类一样“摸鱼”?程序员们