AI热点 2周前 129 阅读 0 评论

MagicOS已成世界「第三极」,荣耀拿下AI大战叙事权

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

全球智能手机迈入AI决战期!在此节点,一个全新自进化AI系统——MagicOS 10破局而出,会思考、会协作,真正懂你所想,一语搞定任务,让手机从此成为一部活着的原生设备。这家中国头部企业,正执掌全球AI终端话语权。


几天前,库克闪现直播间,在中国亲自带货iPhone 17 Air国行版。


从iPhone 17出世,再到Air正式发售,苹果AI鸽了又鸽。


可以说,在当下国内智能手机市场中,苹果新款竟成了最不「智能」的那个。


如今,AI手机,不再是简单的通讯工具。


它正演变为AI产业革命的终极战场,成为通往未来应用生态的超级入口。


AI手机终局之战

谁能交上满意答卷?


放眼全球,智能手机市场正迎来一场AI革命。


Counterpoint报告曾预测,2025年全球GenAI手机出货量超4亿部,预计占全球市场1/3份额。


更具体讲,每三部手机其中就有一部,具备了GenAI功能。而过去一年,这一比例仅为1/5。



确信无疑的是,AI手机正成为世界科技巨头相互角逐的战略新高地。


从硬件到软件,从生态到体验,各大厂商纷纷押注AI,以求在这一轮变革中占据先机。


如今,现状如何?


一直以来,苹果以生态封闭——「围墙花园」著称,在AI领域也不例外,其Apple Intelligence恰是自研模型的核心。


自2024年6月,苹果AI首次亮相后,一系列新功能被无限推迟,多次跳票。


尤其是Siri,最初设想的能力还没有实现,另一边基于自研AI模型,另一边不得不依靠ChatGPT等第三方合作进行功能补充。


苹果基础模型(FM)架构


体验感,可想而知。


今年WWDC大会上,苹果OS 26「全家桶」中,苹果AI能力主要在实时翻译(Live Translation)、视觉智能,弱化了关于Siri的更新。


内外交困,是苹果的现状,也暴露了其在纯自研AI上的短板,难以实现真正「以用户为中心」的AI个性化革命。


作为AI界的扛把子,谷歌推出的Gemini Live实时AI助手,已成为全新Pixel 10系列的标志性能力。


它可以支持自然对话、视觉感知和多模态输入,同时处理图像、文件、视频,甚至与安卓生态深度整合,在跨设备体验上领先一步。



其背后搭载了端侧模型Gemini Nano,还针对自研Tensor G5进行了定制优化。


可以看到,谷歌的路径注重的是「实时性」和「多模态交互」,打造一款活生生的AI伙伴。


尽管强大,Gemini Live仍依赖联网云端处理任务,这意味着在离线场景下,用户深度体验会受限。


再来看三星,主打的是Galaxy AI套件,这是一套「端云混合」的AI解决方案,覆盖了翻译、照片编辑、健康AI等功能。


「端云混合」特点是,既利用设备端快速响应,又借助云端强大计算,实现平衡。


同时,三星还与谷歌Gemini进行了深度合作,Galaxy AI虽全面,很多能力同样依赖云端。



从苹果的封闭自研,到谷歌的实时交互,再到三星的端云套件,路径虽有别但局限相通:


本质上,它们尚未触及AI手机「以我为主」的体验革命。


那么,谁才能打破桎梏,真正定义Ai Phone的未来?


一部活着的AI原生手机


以往智能手机出厂之后,大部分功能已经定型,意味着其功能永远停留在了上市那天。


而真正的AI手机,应该是拥有「自主意识」、能「自我进化」、可以被每个人调教,并且不断成长成越来越懂用户所想的智慧生命体。


马上双十一了,每年在这个全民购物节中,不论是谁都会买买买。


但是,同一商品在各大电商平台上,又有着不同的优惠力度,比如跨店满减、百亿补贴等足以让人头晕眼花。


若光靠人工比对、计算,是可以完成的,但对于牛马们来说,时间不允许也没那么多精力。


这时,一个YOYO智能体即可代劳一切,往购物车添加商品,帮你领券以最划算的价格拿下。



在AI实现购物的这个过程中,前端需具备自然语言理解能力,用户输入指令意图是什么;其次是多模态推理规划,上网检索,并针对优惠规则组合优化;最后,还需自动完成操作和执行。


和好友外出约饭,YOYO能让你全程「动口」完成所有准备:从推荐餐厅、点评招牌美食,到规划路线,甚至自动连接店内WiFi等一系列操作。


你只需拿起手机扫描周边,说一句「帮我推荐这条街的云南火锅店」,短短几秒内,它便给出最优建议。



这背后,需要AI不仅能「看见」现实世界,更能精准理解指令、调用工具并自动执行任务的能力。


餐厅一键打卡领优惠,命令一下,不用手动操作YOYO就替你完成了。


再以身材管理为例,这或许是多数人,尤其是女生常立的flag,但没有他人的监督记录就少了一些动力。


一日三餐,YOYO只需看一眼,就能自动识别所有食物的热量,并同步记录到个人健康系统中。



实现这一能力的关键,除了必备多模态,更需构建个人专属知识库。唯有如此,AI才能更好理解用户的日常饮食,提供真正精准、个性化的健康建议。


毋庸置疑,在工作场景中,YOYO也是个人的得力助手。


临近周五下班前,老板突然让你准备一份调研报告,面对大量数据整理、信息汇总,在短时间内根本搞不定。


如今一句话的事,AI短短半小时就完成了。



理解-检索-分析-生成-优化,这一工作流是AI完成复杂任务的必经之路。


一次完整的出游,往往涉及目的地规划、酒店机票预订、当地美食推荐、导航等多任务串联的场景,更对AI推理、策略优化、工具使用等综合能力,提出了更高的要求。



不仅如此,YOYO还具备了苹果全家桶智联、全品牌PC智联、全场景跨端智联的核心能力,在生态上全方位开放,让用户所有设备共享一个人格和记忆,实现无缝切换。


以上各种场景中,全新YOYO智能体承包了人类美食、出游、工作等日常生活任务。


它的背后是,一款号称能自主学习、持续进化的真·AI原生系统——荣耀MagicOS 10诞生了,并且集成到全新Magic8系列。


不难发现,只有当所有这些能力都能被丝滑地实现时,一台「活着的手机」才真正完美呈现。


自进化「杀手锏」


YOYO智能体能够「自进化」的核心秘诀,主要在「三重能力」的觉醒:


  • 多模态感知:YOYO不只能「读懂」文字,还学会了「看懂」图像,「听懂」音频,「理解」视频。能像人类一样,用多个感官去认知这个复杂的数字世界。


  • 个人知识库:最懂你的人,莫过于记得你一切的人。拥有长达5分钟视频记忆能力的YOYO,能记住上下文,理解你的习惯和偏好,让每一次互动都充满默契。


  • 自动执行:学会了规划、决策,甚至反思的YOYO,不仅能提供建议,还是能够亲手为你完成任务。



荣耀魔法大模型3.0矩阵:四大核心能力解密


首先,在底层能力上,荣耀组建了一支分工明确的AI军团——魔法大模型3.0矩阵。


它们如同智能体的「大脑神经元」,各司其职,共同构成了这个新生「生命体」的核心能力。



  • 荣耀魔法大语言模型(MagicAgent & MagicLM)


云端的MagicAgent系列(Tool, Plan, Ultra)负责深度思考,它们能精准理解你「只可意会」的模糊指令,并科学地规划、拆解复杂任务。


而端侧的MagicLM-Nano则能在手机本地快速地处理敏感信息,保护隐私的同时,实现个性化推理。经过海量数据的锤炼,它甚至涌现出了上下文学习、逐步推理等高级能力,让沟通变得前所未有的智能。


  • 荣耀魔法多模态模型(MagicGUI & MagicVL)


MagicVL-Nano是手机的「端侧大脑」,提供了强大的图像理解能力。它解决了行业内「体积、速度、安全」的不可能三角难题。


小而美:通过轻量化视觉编码器,参数量降至1亿以内,却能保持顶尖的图像理解力。


看得清:创新的「动态分辨率」技术,让它能智能聚焦图片关键区域,既快又准。


学得快:采用「多模态课程学习」,像人类一样从小学读到大学,循序渐进地掌握了「大智慧」。


这意味着,它能以极低的能耗默默工作,既不拖累续航,也让你的照片和隐私数据牢牢地留在本地。


MagicGUI则是「操作执行器」,将MagicVL的智能转化为具体的APP操作。它解决了大模型在手机应用操作中的「感知、定位、推理」难题。


在7月的实际测试中,它在TOP 10主流应用内的操控准确率高达91.5%,比行业同类顶尖开源模型高出整整16.4%。在多个行业开源榜单的测试中,跑分全面领先,是当之无愧的SOTA。


如此强大的模型是如何炼成的?荣耀AI团队设计了一套创新的「两阶段训练范式」:


  • 继续预训练(CPT)阶段:在这个阶段,团队向模型大规模喂与GUI相关的知识。通过合理的数据配比和以规划为导向的推理训练,大幅提升模型对屏幕的感知与定位能力,并增强其在APP内的导航能力。


  • 强化微调(RFT)阶段:学会基础知识后,进入「实战演练」。团队引入了空间增强的复合奖励函数,在统一的动作空间内,对模型的每一步操作进行打分。操作正确,给予奖励;操作失误,给予惩罚。这种方式极大地提高了模型在各种应用和设备上的鲁棒性与泛化能力。


更有趣的是,MagicGUI还有一个堪称「硬核」的训练方式:7x24小时不间断地模拟用户操作,生成千万级高清样本,让它能精准识别广告弹窗、各种复杂界面。



  • 荣耀魔法视觉大模型(MagicImage & MagicVideo)


MagicImage精通图像编辑,它能轻松消除照片中多余的路人、修复老照片的褶皱、去除玻璃反光。更神奇的是,它能精准控制人像的光影,创造出虚化光斑、发丝光等专业效果,一语拯救废片。


MagicVideo则是视频剪辑的一把好手,它能进行像素级的视频分割,精准地编辑你想要的任何区域,让复杂的视频创作变得简单有趣。



  • 荣耀魔法语音大模型(MagicSpeech)


MagicSpeech是全球首个在端侧大规模部署的语音大模型。它的背后,是荣耀与上海交大共同研发的MFLA多语种融合技术。它能做到「边听边译」,延迟极低。


这意味着,即使在没有网络的飞机上,YOYO也能成为你的同声传译。


目前,这项技术已被国际顶会Interspeech收录,可以说是对其科研实力的最高认可。


个人知识库:YOYO的「记忆宫殿」


不过,强大的AI只是让我们拥有了一个无比聪明的工具。我们渴望的,则是一个能够并肩前行的伙伴。


而伙伴与工具之间最根本的区别,恰恰在于那份共享的、不断累积的——记忆


在我们每个人的手机里,都沉睡着一个庞大的、碎片化的「自我」。那是你收藏的帖子、点赞的视频、与朋友的聊天记录、随手拍下的照片……这些数据蕴含着你最真实的兴趣、偏好和人生轨迹。


荣耀要做的,就是为YOYO智能体建造一座「记忆宫殿」。它的使命,就是将这些碎片收集起来,编织成AI思考与决策的基石。


为此,荣耀借鉴人脑的记忆模式,并深度融合端侧AI技术,为YOYO量身打造了一套个人记忆知识库。



通过运用RAG(检索增强生成)、Context Engineering(上下文工程)等前沿信息检索技术,YOYO在每次推理时,都能动态地在上下文中获得最相关的信息。


与此同时,YOYO还采用了「长期记忆 + 短时记忆 + 瞬时状态」相结合的复合策略,支持记忆的动态更新,实现了个人知识的智能分类、语义搜索与自动关联。


这套长短结合的记忆系统,形成了一个强大的「数据飞轮」。你与YOYO的每一次互动,每一次授权记忆,都在为它的「记忆宫殿」添砖加瓦。


随着越来越多的多模态内容,被YOYO转化为可推理、可行动的个人知识,再加上AI Agent和操作系统调用时随时响应,你的手机操作系统便进化为了一个数据驱动、不断丰富、自我进化的「AI操作系统」。


自动执行:学会思考、反思和主动追问


在科幻电影里,我们总能看到一个无所不能的AI管家,比如钢铁侠的「贾维斯」。


你只需动动嘴,它便能为你处理好一切——订机票、分析数据、甚至帮你应付一场突如其来的危机。


现在,荣耀正在用YOYO智能体,将这个幻想一步步拖入现实。


要成为合格的「贾维斯」,光会执行指令是远远不够的。它必须学会像人一样思考。


为此,YOYO智能体采用了一种先进的Plan Agent (PA) + Execute Agent (EA) 架构。


当接收到用户指令时,PA利用大模型的推理能力,将复杂目标拆解为一个个可执行的子任务。


这一过程的背后,是基于MagicGUI大模型基座提供的多模态感知和自动化执行能力,形成了一个「感知-记忆-执行」一体化的完整技术闭环。


用户下达指令并授权后,YOYO的视觉编码器会实时捕获屏幕信息,自然语言模块解析任务意图,大模型进行推理决策,最终通过多模态执行引擎完成精准操作。


经过持续的模型调优与训练,YOYO智能体在五个核心方面实现了自我进化


1. 读懂你「一言难尽」的需求


过去,你对AI说一件事,它做一件事。但现实中,我们的需求往往是复合的。


比如,你拍了一张活动海报,对YOYO说:「帮我完成这个活动。」这背后可能包含了一系列任务:打开大众点评、找到这家店、收藏、打卡、点赞、写评价。


YOYO通过其多模态意图理解能力,能像人类一样,一眼看懂海报上的所有信息,并将其拆解成一个完整的任务流,然后一步步帮你完成。


这在技术上,是全行业首次用一个多模态模型,同时完成了「多模态意图理解」「图片信息抽取」这两项高难度任务。



2. 记住长达9步的复杂对话


正如前文所述,AI的一大痛点是「记性差」,聊着聊着就忘了上下文。


YOYO通过深度神经网络和更庞大的训练数据,学会了在复杂的对话中保持记忆。它能通过层级化排序和智能压缩技术,抓住最关键的信息。


这意味着,你可以和它进行一场长达9个步骤的复杂对话,它依然能清晰地记得你们聊天的前因后果,并准确执行。而这,同样是行业内首次实现。


3. 从被动应答到主动追问


「帮我搜个篮球。」 这句话看似简单,却信息模糊——用哪个APP搜?买篮球还是看篮球比赛?一个平庸的AI可能会随便猜一个,或者直接报错。


但YOYO不一样,它学会了人类最重要的沟通技巧之一:主动追问


当它觉得你的指令不够清晰,或者缺少关键信息时,它会像一个细心的助理一样反问你:「请问用什么APP帮您搜索呢?」


这个行业首创的能力,让AI变成了一个能与你有效沟通的伙伴,极大地提升了交互的流畅度和准确性。


4. 让智能体拥有「纠错」的智慧


早期的自动执行,就像设定好导航路线,然后蒙眼开车,一旦遇到修路或者堵车,就只能束手无策。


而YOYO则是行业首个进化出反思能力的自动执行智能体。它不再是机械地执行预设好的路径,而是「边执行边思考」


如果在操作过程中,APP突然弹出一个广告,或者界面更新了,YOYO能立刻意识到变化,并实时调整自己的执行策略。


这种强大的泛化能力,让它无需为每个APP单独适配,就能「看懂」界面。


5. MCP带来的「团队协作」革命


AI要真正强大,就需要能调用外部的各种服务和工具。


但过去,让AI和第三方APP「对话」(接口联调)是一项极其繁琐、低效的工作,充满了重复劳动和沟通成本。


荣耀给出的答案是MCPA2A


  • MCP可以被理解为「AI界的Type-C接口」。它为AI与各种服务之间建立了一套标准化的连接方式,让它们能够「即插即用」。


  • A2A则负责协调不同智能体之间的协作。它让来自不同厂商、采用不同模型的智能体,能像平等的团队成员一样,发现彼此、分配任务、协同处理复杂问题。


作为首个支持MCP和A2A协议的终端厂商,YOYO的「朋友圈」正在以前所未有的速度扩大。


从接入阿里飞猪、高德地图,到联动大麦、淘票票,再到与美的智能家居深度合作,YOYO正在编织一张覆盖你衣食住行的巨大智能网络。


如今,荣耀已接入超过4000个生态MCP和生态智能体!这个数字,堪称地表最强。



全球终端AI未来

荣耀率先执掌话语权


从YOYO不断的「自进化」中我们不难发现,荣耀在探索的,是一种全新的、更智能、更人性化的人机交互未来。


其实,这一愿景早在今年3月——「阿尔法战略」提出之时,就被勾勒出来了。


具体来说,「阿尔法战略」一共包含三大阶段:


第一步,在AI智能体时代,打开技术的边界,共创AI终端的新范式,打造一部真正的智慧手机。


第二步,在物理AI时代,打开产业的边界,共创AI生态的新范式,构建一个智慧的生态。


第三步,在AGI时代,打开人类潜能的边界,共创人类文明的新范式,创造一个智慧的世界。


它绘制出了AI的终极图景:从打造智慧手机、构筑智慧生态,到拥抱智慧世界,以端侧AI为先、以人为本释放人类潜能的战略方向。


如今,荣耀已从技术壁垒,到生态开放,再到市场表现、用户共创中,实现了全链路突破。


不卷参数,定义新范式


回溯智能行业的发展脉络,我们不难发现一个尴尬的现实——参数内卷已成常态,谁的像素更高、谁的处理器更快,似乎成了唯一的胜负手。


但荣耀「自进化AI原生手机」的提出,彻底宣告了低效内卷的终结。


同级芯片,跨代领先,荣耀Magic8系列毫无疑问是目前性能最强的旗舰手机,但它并非依靠简单的硬件堆砌,而通过底层技术重构,实现了从「参数内卷」到「范式突破」的质变。


在底层技术创新中,荣耀研发了低bit量化技术,让模型存储省30%、推理速度飙升25%、功耗降25%。



再加上,新一代向量化检索技术,让检索效率推升了400%。


这些看似枯燥的数字,实际解决了行业痛点,即云端AI往往延迟高、隐私风险大,而端侧AI受限于手机的计算资源,无法高效运行。


借助这些突破,让YOYO智能体实现了「毫秒级图像风格迁移」、「一句话取消自动续费」等体验。


如果说技术壁垒是「硬实力」,那么生态开放则是荣耀「软实力」的体现。


打破孤岛,无界智联生态


传统手机生态往往封闭:数据孤岛、服务孤岛、设备孤岛,让用户在多设备间疲于切换。


而荣耀Magic8系列打破了这「三座孤岛」,开辟行业「全品牌智联」的新蓝海。


就拿「苹果搭子」来说,全家桶智联,可以让手机与MacBook实现无缝「素材拖拽」、与iPhone同步验证码、与Apple Watch共享邮件等。


这解决了「双机党」的频繁切换设备的烦恼,荣耀也成为了苹果全家桶「最佳搭档」。



甚至,在全场景中,它还实现了「跨品牌 + 跨空间」的服务流转。



YOYO的「搭子」角色——购物、美食、出游、健康、工作,正是生态开放的生动体现。


目前,YOYO支持的场景覆盖从200个跃升至3000个,远超行业平均水平。


在全球视野下,这种生态开放恰恰体现了中国叙事的智慧。苹果、谷歌等科技巨头,往往封闭生态强化用户锁定。


荣耀却以开放姿态,提供「第三选择」。


一家成功企业的突破不会止于技术和生态,还要延伸到「用户共创」层面。


这是一种哲学转变——从「厂商定义一切」到「用户主导进化」,让手机从「出厂即体验终点」变成持续成长的伙伴。


这一次,荣耀发起了「YOYO许愿池」计划,打破传统的这种单向定义。



用户可直接向YOYO提需求,建议直达产品团队,配合「MagicOS月月焕新计划」,可直接通过月度OTA快速落地。


这种机制强化了手机的「生命感」,让人们真正感受到自己在塑造设备的成长。


这种情感连接,正是AI时代的人机关系的重构。


全链路突破的最终检验,就是市场的表现。在激烈竞争市场中,荣耀实现反弹重返第一梯队。


Counterpoint最新数据,荣耀中国市场位列第五。在海外,荣耀Q2欧洲市场出货量同比增长 42%,在TOP 5 厂商中实现最大增幅。


值得一提的是,荣耀还在上个月荣获中国信通院「L3卓越级」认证,证明了其在端侧AI的权威性。



此外,荣耀还计划在未来五年投入100亿美元,全球布局研发中心,为AI技术迭代与生态构建提供坚实支撑。


综合 「战略+技术+资金」的协同,荣耀在全世界的AI领导力显露无遗。


这标志着,中国企业正从「技术输出」升级为「标准与叙事定义」,在AI生态竞争中执掌话语权,引领全球终端产业迈向「中国定义」的新阶段。


在当下,谁掌握叙事权,谁就掌控了未来。


荣耀,已然在前。



新物种

HONOR ROBOT PHONE


Ai Phone的下一个未来,是什么?


那一定是HONOR ROBOT PHONE,一个将AI外化到物理世界的「新物种」。



未来,手机不再只是握在手中的设备,而是能自主行动、感知环境的机器人。


它有着「超强大脑」,可以让智能手机的智慧能力突破屏幕的限制,拓展到更复杂的现实场景中。


而Magic8正是HONOR ROBOT PHONE的前身,明年巴塞罗那,将会重磅揭晓。


文章来自于“新智元”,作者“好困 桃子”。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!