AI热点 2小时前 191 阅读 0 评论

1个 AI Agent=4个工厂老师傅?|和王筱圃聊时序大模型和 toB Agent 这门生意

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章


今年我们关注了很多面向 ToC 用户的 Agent 产品,本周我们来聊聊面向 ToB 的 Agent,很可能 Agent 创造最大的商业价值不是在 ToC 而是在 ToB。


8 月底,AI Agent 被写入了国务院印发的《关于深入实施“人工智能+”行动的意见》。很多人认为,这是继十年前提出“互联网+”并且我们的生活被外卖、打车等等互联网+服务改变了之后,又一个前沿技术与各行各业结合的新的重要的机遇时刻。


接下来一段时间,「十字路口」也会做一系列相关的内容。


本周,我们关注 Agent 与工业结合正在发生的变化,我们邀请研发时序大模型 Geegobyte-g1 以及工业智能体平台「河谷」的初创企业极峰科技的创始人王筱圃,和我们聊一聊什么是时序大模型,和大语言模型的区别和具体的案例,他们如何训练一个 Agent 并把它卖给企业投入到生产流程中。希望能对大家了解 AI Agent 如何应用于工业生产有所帮助。



快问快答


👩🏻 Ronghui


首先我们和筱圃来做一个快问快答。年龄?


👦🏻 王筱圃


88 年生人。


👩🏻 Ronghui


毕业院校?


👦🏻 王筱圃


中科大。


👩🏻 Ronghui


MBTI 和星座?


👦🏻 王筱圃


MBTI 没有系统测过,但是 I 人确定,后面不太清楚。星座是天蝎座。


👩🏻 Ronghui


一句话介绍一下现在的公司和产品。


👦🏻 王筱圃


我们公司就是向工厂客户派遣 agent,数字工人替代人类技术工人去管理和控制产线生产。


👩🏻 Ronghui


融资情况?


👦🏻 王筱圃


去年刚成立的时候就完成了千万级的天使轮融资,今年准备再做一轮 Pre-A。


👩🏻 Ronghui


收入和利润。


👦🏻 王筱圃


整体订单规模是千万级,利润水平在 AI 企业中相对较高,但研发投入也很高。


👩🏻 Ronghui


团队规模。


👦🏻 王筱圃


目前有将近 30 名全职员工。


👩🏻 Ronghui


创业之前你在做什么?


👦🏻 王筱圃


在做快乐的打工人之前,我带领 R&D 团队研发 AI+工业数字化的产品并交付项目。在那之前也做过一段时间的基础算法研究,包括计算神经科学和脑科学相关研究。


时序大模型不是另一个 ChatGPT


👩🏻 Ronghui


我们先来说一说时序大模型,请筱圃科普一下,什么是时序大模型?


👦🏻 王筱圃


时序就是时间序列的意思,指随时间变化的记录。我们生活中有大量时序信息,比如股票价格的波动、跑步轨迹等。时序信息有前后顺序,也存在因果关系,过去影响现在,进而影响未来。AI 领域的时序模型目标就是根据已发生的事预测未来可能发生的事,帮助做出最优或接近最优的决策。


时序模型研究已经有很多年,从上世纪 70 年代就有相关工作。它和日常生活结合紧密,比如开车导航到目的地需要多久,它会帮你选路线、避开拥堵,预计到达时间通常很准。


现在大家对大语言模型已经很熟悉,它的研发目标是通过大参数量、大数据量和大规模训练,让模型具备泛化能力,可以翻译文本、写代码等。时序大模型的目标类似,也通过预训练模型来完成时序预测和决策。通过大规模训练得到预训练模型后,可以在各行各业、各种场景中发挥作用。这就是为什么要做时序大模型。


👩🏻 Ronghui


它和大语言模型还是有很多不一样的。


👦🏻 王筱圃


当然。虽然它们都是基础模型,但训练数据不一样。大语言模型的训练数据多是语料信息、文字和互联网公开数据,训练目标是 generation,即生成语言或图片。而时序模型的训练数据是带有时序特征的数据,训练目标是预测未来并生成更多可供决策的参考


所以我们常说,大语言模型是「和人对话」,时序大模型更多是「和未来对话」,让未来变得可预测、可管理、可优化。


👩🏻 Ronghui


你们看到它现在在哪些领域应用比较广泛?


👦🏻 王筱圃


时序大模型的应用非常广泛。比如在交通领域,可以预测到达时间。夏天是用电高峰期,居民用电趋势具有时序特征,比如晚上大家回家开空调,白天在工作场合用电多,所以在电网能源调度层面,也会让时序模型发挥预测作用,帮助调度能源,让能源去到该去的地方,用电更稳定。在医疗领域,比如心电图监测,也有广泛应用。


👦🏻 Koji


这说的是时序模型的应用,对吧?


👦🏻 王筱圃


对,时序大模型的应用。当下在工业界、市场营销、供应链管理领域,都有国内外企业用这项技术完善产品,提供更多功能。


👩🏻 Ronghui


可以举个例子吗?比如营销,刚刚你提到它可以用在营销上。


👦🏻 王筱圃


比如对用户行为的分析,需要对发展趋势做预测。哪些产品会因为广告投放和曝光而增加需求,哪些不会,这就需要时序模型分析。在营销层面,它能帮助更有针对性地做产品宣传,市场投放也是用「看未来」的形式支持当下决策。


再往深处说,对未来产品销售订单量的预期也会影响工厂生产安排。比如某款洗发水销量特别好,未来可能薄荷味卖得最好,那么就会增加薄荷味的生产订单,销量不佳的品类则减少订单。这就是供应链层面通过时序预测拉动生产供给。


时序大模型和时序模型作用相同,但规模更大。为什么要做大?因为参数量和规模更大,可以在各个领域发挥更好作用,而不需要为单一领域研发小模型。一个通用型大模型就能泛化解决各行各业的问题。这就是通往 AGI 的方向,也是大语言模型和时序大模型演变的路径。


👩🏻 Ronghui


那国内外有哪些公司在做类似的事?有哪些已经和普通人生活很近的成果?


👦🏻 王筱圃


金融、教育领域都有应用,在工业和制造业也有很多公司使用时序大模型。无论初创企业还是成熟企业,国内外都有。


国外有一家英国初创团队 Applied Computing,是帝国理工的团队,刚完成种子轮融资,规模将近 1 亿人民币。他们研发的基础模型 Orbital 面向工业生产过程中的能源、化工、石油、石化等领域,做过程管理、控制和优化。


国内的华为也发布了很多盘古大模型的产品和技术,其中有一个分支叫盘古预测大模型,或者盘古时序大模型,应用在钢铁、有色金属、水泥、气象等领域的预测任务中,这是非常成熟的应用案例。


👩🏻 Ronghui


种子轮融资 1 亿人民币,这在时序大模型领域算常规金额吗?


👦🏻 王筱圃


应该算体量比较大的种子轮。


近年来欧洲尤其是英国的语境下,工业生产不仅关注效率,更关注污染问题。无论在中国还是欧洲,各国都在关注如何在生产更多产品的同时,减少二氧化碳排放,减少大气污染。这是非常重要的衍生话题。所以资本重点关注低碳工业,也是这些团队受到青睐的核心原因。


👦🏻 Koji


这确实有商业价值。


为什么要做?


👩🏻 Ronghui


我们也看到一些媒体报道极峰科技的工业智能体平台「河谷」。之前聊天时你提到,你们核心在做的是把工厂里的工人能力复刻到一个 agent 上,等于是做一个「数字技术工人」。这个过程还挺有意思的。不过你可以先跟听众讲一讲,你们所面向的工业场景大概是什么,让大家先有一个画面感。


👦🏻 王筱圃


我一般会用大家比较熟悉的场景来解释,就是 AI +工业的场景,有点类似「钢铁侠」里的智能助手「贾维斯」。贾维斯能帮钢铁侠干什么呢?他其实是一个非常全能的个人助手,但其中最重要的一部分工作是帮钢铁侠打造战甲。


比如老板(钢铁侠)提出需求:“我要一款能在太空中抗低温、抗腐蚀的战甲,还要配备什么武器。”贾维斯就会开始设计,从外观到运动结构,再到动力系统和软件系统,都能完成。这其实就是 AI 辅助工业设计。现在很多行业玩家都在用大模型结合仿真技术,让 AI 自动完成工业设计。


但光有设计还不够,战甲还要生产出来。于是贾维斯会操控各种炫酷的生产设备,帮钢铁侠打造 Mark3、Mark4、Mark5 等战甲。钢铁侠本人可以去做别的事情,生产完全由贾维斯完成。这个过程其实就是工业生产的过程管理与控制


所以,极峰科技使用 AI 赋能的关键场景就是:根据工业设计形成工业产品,强调过程控制。和很多专注于机器人运动控制(motion control)的企业不同,我们更关注的是生产过程中如何进行管理和控制。我们的场景就是驱动产线设备,把原材料加工成企业需要的产品。


👦🏻 Koji


就是连续性生产这个领域,对吧?


👦🏻 王筱圃


对。我们叫流程工业,常见于冶金、化工、新能源材料等领域。


刚刚说的贾维斯例子,更接近另一类生产模式——离散型生产。比如小米、蔚来、理想的汽车生产:先是底盘、再是四门两盖、发动机、电机等逐步组装。因为车型很多,工序复杂、管理复杂(订单、BOM、原材料),但工艺相对简单,这就是离散型生产。


而我们聚焦的流程性生产,特点是产线一旦开动就不关停,原材料持续投入,产品持续产出。它不强调计划管理,而是强调生产过程的稳定性、效率和质量


换句话说,我们不是在帮钢铁侠组装战甲,而是在帮他生产战甲的原材料,比如铁、铝、铜这些基本构件。



👩🏻 Ronghui


过去讲智能制造,大家常说这是一个降本增效的过程。那在之前的过程中,有哪些问题是需要今天的技术来解决的?


👦🏻 王筱圃


单说流程性制造,它的工艺本身非常复杂,经常同时涉及物理反应、化学反应和能源的参与,整体过程相对不稳定。传统工业过程的解决方案在这种场景下往往显得力不从心。


如果完全依赖自动化产线去应对复杂工艺,就会遇到问题。自动化大多是规则驱动(rule based)的,一旦生产工况发生变化,可能导致产品质量下降、能耗增加、原材料浪费等情况。这些问题在流程工业里非常普遍。


那如何弥补自动化的刚性?答案就是人。技术工人具备灵活性,他们能临场反应,结合知识和经验做出判断,补足了产线的不足。因此在流程性生产过程中,我们长期依赖技术工人来参与生产管理和控制。


👩🏻 Ronghui


所以你们要做一个「数字技术工人」,这听起来难度很高。


👦🏻 王筱圃


是的,但我觉得这是非常必要的事情。


人类工人最大的优点是灵活性、善用工具、知识积累和沟通能力。比如一个新工人可以跟师傅学习,听懂指导,并在现场应用。但人也有局限性:


  • 人会累:比如化工生产,一旦走神就可能带来严重安全事故。事实上,很多低效生产情况发生在午休或夜班,因为工人疲劳导致注意力下降。
  • 知识传承效率低:技术工人的培养主要依靠师徒制,经验传递低效且不可规模化。


所以我们希望通过 agent + 大模型,把人的优点固化下来,并且放大,甚至超越人。这就是「数字工人」的研发目标,也是我们核心产品的价值所在。


👩🏻 Ronghui


那这种数字工人更适合哪些领域?


👦🏻 王筱圃


在工业领域,大家都在尝试不同的应用:在工业领域,其实不同环节都在尝试利用人工智能替代原有人力。比如工业设计,过去依赖设计院专家的知识,现在逐渐由 AI 完成从辅助到替代的过程。而车间内,技术工人直接参与生产,我们正在推动数字工人替代他们在操作、运维、安全、计划、能源调度等岗位上的工作,路径也是“先辅助、再替代、最终超越”。


所以它不是针对某一个单点,而是覆盖整个流程。以前的自动化往往是单点优化,但局部优化 ≠ 全局优化。数字工人的目标就是把从原材料到成品的整个流程进行全局协同优化


👦🏻 Koji


你们推出的工业智能体平台「河谷」和时序大模型是什么关系?


👦🏻 王筱圃


可以类比为现在的通用 agent 平台和大模型的关系


「河谷」智能体平台是配置化的 agent 工作流平台;而我们的时序大模型是平台里关键 agent 节点背后的「智力来源」。


👦🏻 Koji


这个平台是开放给客户的,还是你们自己用?


👦🏻 王筱圃


这是我们和一些其他的 toB agent 供应商的不同思路。工业场景的工作流牵涉到生产过程的直接干预,需要专业知识和经验配置参数,所以我们认为用户很难直接配置


我们的判断是:toB 场景下,更多是 配置好的智能体应用交付给客户使用,而不是让客户自己配置。因为在工厂里很难找到一个合适的用户角色去配置 agent。


那为什么还要做一个智能体平台呢?有两个原因:


  1. 技术价值:单一模型解决不了流程的稳定性和可观测性,需要 agent 平台去集成。
  2. 团队效率:我们 23 个全职员工要同时支持 7 个行业、15 个工艺工段。如果没有配置化和模块化,就会回到定制化交付的老路,效率太低。


所以「河谷」不仅符合技术逻辑,更是我们自身研发人效的需要。


这点也体现了我们与当下很多 toB Agent 供应商的不同。工业场景涉及生产流程的直接干预,需要非常强的专业性和参数调试经验。我的判断是,大多数 toB Agent 未来会以配置完成后的智能体应用交付给客户,而不是让客户自己配置。


原因很简单:工厂里很难找到明确的配置者。总工程师、工艺专家还是一线工人?谁来承担这个角色?如果没有清晰的定位,说明用户暂时并不需要自己配置 Agent。对我们来说,这部分由我们来做。


更重要的是,我们团队只有 23 个全职员工,却同时要支持 7 个行业、15 个核心工艺工段的研发和交付,对人效要求极高。如果不能把工业流程原子化配置,不能快速组合模型并保证泛化性能,就只能回到传统的定制化交付模式,效率很低。


因此,我们必须让配置化成为可能。对客户,这意味着可复用、可扩展;对我们,这直接决定了工程师的人效和产品能否快速上线。这就是我们要做 Agent 平台的逻辑——不仅符合技术发展趋势,也符合我们自身研发和交付的需求。



(河谷工业智能体平台 - 用于工厂场景的AI Agent工作流快速配置搭建


怎么做?


👩🏻 Ronghui


你们是怎么打造「数字技术工人」的。比如整个训练需要多长时间?它要理解整个生产过程,还要把老师傅脑子里的经验,包括临时应变时的一些成熟判断,内化成能力。这个过程具体是怎样的?


👦🏻 王筱圃


要复刻一个人类工人,把他变成数字体或智能体去胜任岗位,本质上是复刻他在岗位上的特质。总结下来,人有四个关键特质:


第一是观察感知。工人每天上班,第一件事就是看监控界面上的生产指标。不只是看数据,现在很多工厂、产线和设备都有智能化监控,甚至配备了耐高温、耐腐蚀的高清摄像头,可以直接拍摄反应过程。工人会结合视频流、数据流去判断情况。


第二是思考推理。比如温度骤降,或者设备运行速度变慢,他就要思考原因。可能会回想起上学时学到的原理,或者师傅传授的经验,综合起来做出判断。


第三是决策。当判断完成,就要决定该怎么干预:调哪个参数?停哪个设备?启用哪个环节?


第四是执行。人最大的特质是敢想敢干。工人会通过上位机控制系统、下位机电气化系统,直接干预设备控制回路,影响生产动作。


所以我们要复刻的就是这四大动作,对应的认知流程和行为逻辑。相当于给数字工人构建一个“大脑”,也要有不同的“脑区”:


  • 知识与语言处理:由「大语言模型」承担,经过特定场景微调,让它能解析工业知识、理解信息、生成指令。
  • 模式识别与预测:由「时序大模型」承担,负责因果推理、数值响应、未来工况预测。


但有了“大脑”还不够。人的行为模式是闭环,所以我们需要 agent 来组织工作流程


  • 记忆:短期记忆记录昨天干了什么,长期记忆存储几个月前的经验。
  • 可控与可解释性:通过 agent workflow,每个环节的 input 和 output 都可观测,出了问题能定位原因。


最终,我们用 agentic workflow 表达一个数字工人的常规工作流程,这样才能得到真正的数字工人。



(极峰科技极简风的AI Agent流程界面 - 客户端)


👩🏻 Ronghui


在开发过程中,你们和老师傅会有碰撞吗?


👦🏻 王筱圃


老师傅大概只占工人总数的 6.5%,他们受过较高教育,多数是工艺或电气自动化方向的专家。他们对技术理解力很强,不存在「听不懂」的问题。只要解释清楚逻辑,他们普遍持开放态度,也能认可价值。


但人与人沟通有距离,不会一开始就掏心掏肺。所以我们在产品落地时不会过度依赖访谈。语言表述总有信息损失,如果只靠对话去复刻,就容易变成一本操作手册,最终又回到 rule-based 的老路。


因此我们更关注工艺本身的规律。比如燃烧、电化学、聚合、加氢、裂解,都要回到物理和化学的第一性原理。同时我们依赖数据——数据不会撒谎。工厂产线给出的响应是真实的,我们会以数据演变过程作为强有力的支点,去形成数字工人的初始版本。


老师傅的经验当然有价值,但这些价值更多体现在数字工人上岗后的短期与长期记忆中,用来逐步纠偏和提升。


👦🏻 Koji


这个具体是怎么实现的?


👦🏻 王筱圃


我们刚刚讲的是 agent 产品的成长性问题。落地到客户现场之后,它必须具备一个持续成长的过程,而不仅仅停留在初始状态。这意味着 agent 需要长期记忆的积累,就像人一样要逐步成熟。


其实我们现在的产品也经历了一个从初期探索到逐渐成熟的过程。最早在 2023 年左右,当时「agent」这个概念还没被提出时,很多基础大模型公司直接基于大模型开发终端应用,比如“帮我生成 PPT”,“帮我翻译一段文字”。这种方式的结果往往不稳定:PPT 质量一般、翻译缺乏文采。我们当时也走过类似的路,把时序大模型和大语言模型接入现有信息化系统,通过多输入多输出的方式直接产出结果。


但很快我们发现了局限:这种模式和基础大模型面临的困境一样——结果不可控,质量不可控,决策是黑箱化的,没有清晰的工作流程。在工业场景中,这种不确定性是完全不能接受的。而且早期缺乏 Chain of Thought(COT),决策过程既不可观测,也难以调整。你给它什么,它就回什么,很难优化。


于是我们引入 agent 来解决这个问题。第一个突破就是提升可观测性。agent 每一个步骤在想什么、做什么、依据什么、下一步可能做什么,都可以通过自然语言交互展现出来。第二个就是成长性。现在很多 agent Infra 公司都在关注 memory——如何存储和管理 agent 的短期记忆和长期记忆。在工业场景里尤其重要。


人的成长不是一成不变的。新入职时的能力和工作几年后的能力是完全不同的。数字工人也需要这样成长。它要学会从短期记忆中筛选,哪些保留下来提升近期表现,哪些转化为长期记忆,成为未来工作的指导。


👦🏻 Koji


那你们是怎么做的呢?


👦🏻 王筱圃


一开始我们也尝试过一些通用的 agent memory 方案,包括开源的,但在实际应用中发现很难完全满足需求。我们处理的是时序数据流,和语言模型的记忆方式并不完全一样。于是我们选择在一些成熟的开源框架基础上,做定制化研发,专门解决短期记忆留存和长期记忆转化的问题。


目前我们会保留一些关键的近期事件,并把它们转化为长期记忆来指导工作流。虽然还不够成熟,但已经能满足现在的需求。未来我们希望能和行业内更专业的 agent Infra 公司合作。


工业场景对 memory 的要求和互联网应用不同。我们对网络稳定性、沙箱、并发等需求并不高,因为我们的环境主要是工业以太网。但我们极度在意「记忆」:


第一,记忆必须有效,短期和长期的转化要合理


第二,记忆必须可显示化管理


现在很多大模型的 memory 是黑箱的,你不知道它记住了什么。在工业里这很危险,因为它可能记下一些不该记住的东西。因此,我们非常关注 agent memory 的可视化管理。这是未来优化产品的重要方向。


另外,还有一个重点就是多 agent 协同。在工厂里,工人之间需要打电话、沟通、共同决策。同样,agent 之间也必须协同。但工业场景有特殊要求:它不能像一般场景那样靠「投票」做决策,否则延迟太大,产线需要的是毫秒级响应。


所以我们采用的是「centric agent」(中心智能体)的模式。由一个核心 agent 负责协调,执行 agent 配合完成任务。这样既能保证时效性,又能兼顾决策的准确性、安全性和稳定性。



👩🏻 Ronghui


你提到 agent 的成长。如果类比人的成长,人是在实践和学习中成长的。但在交付之前,它没法实践,这怎么解决呢?


👦🏻 王筱圃


这个就涉及到第一性原理的价值。我们公司的交付模式之所以强调做大模型,是因为大模型具备极强的泛化能力,我们的目标是面向工艺级别的泛化。


比如在去客户现场之前,我会先了解你的核心工艺是什么。目前我们能覆盖的工艺包括燃烧工艺、冶金、新能源、化工等。例如燃烧反应、电化学方向(有色金属电解、电解水制氢)、合成和聚合工艺,这些在材料和化工领域都有广泛应用。


因此,在模型「上岗」前,它的长期记忆并不是针对某一家工厂,而是来自类似或相同工艺场景的经验积累。换句话说,它的知识来源于跨场景、跨行业的长期记忆。这就像医学生在大学阶段学习各个科目,然后在实习时进入不同科室锻炼。通过这种方式,我们在第一性原理层面上增强了模型在相同工艺间的泛化性。这也是时序大模型的核心意义:在进入客户现场前就已经做好充分准备。


另一个意义在于解决工业界数据稀缺的问题。大语言模型可以通过爬虫获取大量语料,但工业数据无法这样获得。例如垃圾焚烧或化工合成氨,如果只依赖某一家工厂的数据积累,周期可能长达 6-8 个月,性价比极低。工业数据稀缺且难以集中,所以我们必须最大化利用已有数据,把它们抽象到第一性原理层面。比如冶金工艺的燃烧数据和垃圾焚烧的燃烧数据,都可以服务于同一个基线模型。这也是我们做大模型的核心原因。


👩🏻 Ronghui


但是老师傅真的愿意把经验交给一个模型吗?毕竟这可能替代他们的工作,他们为什么要教它?


👦🏻 王筱圃


首先,我们并不依赖老师傅的口述经验作为建模依据,这是基本逻辑。因为同样的场景下,A 师傅、B 师傅、C 师傅的说法可能完全不同,存在冲突。所以我们依赖的是第一性原理和实际数据,而不是师傅的经验传授


但最终使用我们产品的确实是这些一线工人,因此必须考虑他们的接受度。好的 toB agent 产品,应该自然嵌入工人的工作流,而不是让他们承担高昂的学习成本。很多 toB 大模型产品的问题在于需要用户学习 prompt、搭建工作流,这对于一线工人和管理者来说门槛过高。


我们的方式是「影子陪跑」。初期,数字工人不会直接控制设备,而是像实习生一样跟在师傅旁边,看相同的画面、听相同的数据,并给出决策建议。师傅通过对比判断它是否「基本靠谱」。随着时间推移,系统会逐步切换到实际生产,但师傅依然全程监督,像以前一样坐在岗位,只是不用动手操作了。


久而久之,工人发现系统运行稳定,注意力自然下降,慢慢把信任交给数字工人,甚至会去处理其他工作。这一过程顺利地让数字工人融入日常工作流,没有额外的培训成本。


因此我们从未遇到工人抱怨「带来麻烦」,相反,他们会觉得更轻松、更高效。这才是 toB agent 产品真正的价值。


👩🏻 Ronghui


那如果在刚开始的试运行阶段出现错误,责任算谁的?


👦🏻 王筱圃


这是一个责任归口的问题。工业现场的管理规则非常严格。不同于自动驾驶在出事故时责任边界模糊,工业场景中每一步都有明确的记录和追溯机制


我们的 agent 在工作时会完整记录思考过程、决策结果以及执行器的反馈。生产端的规则会有严格的管理体系,我们会有明确的责任边界去判断是在哪个环节出了问题。同时工业现场有安全仪表系统和设备熔断等兜底措施。目前为止,还没有因数字工人导致的严重事故。即便未来出现问题,也会有清晰的责任划分和归因机制。


👩🏻 Ronghui


就像你说的,数字技术工人的终端用户是老师傅,但买单的是工厂。但 toB 企业一个经典的问题就是:「你卖的人不是最终使用这个产品的人」。你们是怎么卖给工厂的?


👦🏻 王筱圃


确实如此,决策人不是最终使用者。2025 年春节期间 DeepSeek 爆火,大家都在讨论大语言模型的能力,工业界客户们也都在关注,被这项出圈的信息包裹。所以在 2025 年年初,大量工厂企业在寻求基于国产大语言模型解决生产问题的方法。


我们的很多客户在找到我们之前,实际上已经采购了华为昇腾计算平台 + DeepSeek 这种一体机产品。但是在真正上线之后,发现基于企业知识图谱的构建,或者在办公过程中的会议纪要自动记录、财务人员机械性和重复性的图表生成等工作,虽然有用,但真正带来直接的经营化收益暂时还没有感受到。


所以很多客户在接洽之前,把我们定位为大模型供应商之一,形象约等于卖一体机或者卖知识图谱的供应商,都是「搞 AI、搞大模型的」。他们认为我们是来解决这些问题的。实际上,一开始他们不能说抵触,但对功效抱有一些怀疑。他们会想:这是不是样板工程、领导工程,而不是与生产真正结合?”


所以我们到现场最重要的事情,不是告诉企业决策人和管理者我们是大模型公司或 agent 公司,而是告诉他们,我们是来解决实际生产问题的。我们要把技术采购逻辑转化为投资逻辑:投资了「数字工人」这款产品,什么时候能收回成本?不仅收回成本,还能继续盈利。大部分企业决策者真正的思维,就是投入产出比,这是他们基本的经营管理逻辑。所以沟通过程中,更多需要以这种模式去交流。


👦🏻 Koji


刚才提到 DeepSeek,你们现在用的基模是什么?


👦🏻 王筱圃


我们用过 DeepSeek,也用过千问。我们主要依赖大语言模型来处理非结构化文档,比如工作日报、工艺包资料,把它们解构成结构化信息,用于支撑产线的决策和推理。


我们非常看重两点:


第一,语义理解和输出质量,尤其是专业性,不能出现幻觉式回答,否则客户体验会很差;


第二,小参数量模型的稳定性。我们的终端硬件限制显存,只能跑量化版本的模型,比如 4bit 或 8bit 的版本。


我们现在常用千问 14B 以及 DeepSeek 小规模模型。这些模型虽然参数量不大,但只要在目标任务上稳定可靠,就能很好地满足需求。这就是我们对大语言模型的核心期待。



👦🏻 Koji


那在生产过程中核心的时序大模型,你们是完全从头训练的,还是基于开源模型?


👦🏻 王筱圃


时序大模型的研究从 2021 年就开始受到关注。最早的代表是 Informer,之后 Google 推出了 TimesFM,主要应用在零售、电力等场景,用于零样本迁移预测。清华团队也在今年年初也发布了 TIMER-XL,在天气和能源领域都有很好的表现。大家基本都是基于 Transformer 的网络结构做各种变种。


我们也参考了这些学术成果。但工业数据和金融、交通、能源等领域的数据有显著差别。工业过程往往是大滞后系统。比如开空调调到 24℃,温度不会立刻到达,而是从 26℃ 降到 25℃,再到 24℃。到了 24℃ 可能又太冷了,你又要往回调,这种滞后性在工业里非常普遍。


因此,模型必须能够跨时间序列捕捉特征和关联,处理多变量、斜变量交织的情况。这对模型的垂直化适配提出了很高要求。我们会在现有开源模型的设计逻辑上做参考,但最终还是要结合工业场景的特点,从头训练属于我们自己的时序大模型。这就是我们现在 G1 模型研发的方向。


做出了哪些成果?


👩🏻 Ronghui


你刚才提到的垃圾焚烧电厂,可以用他们来举个例子吗?比如你们是怎么跟他们签单的?他们在应用你们的产品之前是什么情况?用了之后又发生了什么变化?


👦🏻 王筱圃


这个行业和大家的生活可能有点远,我先解释一下他们是做什么的。我国的城市居民垃圾基本已经基本不再填埋,而是通过焚烧,把垃圾的热值转化为电能。从垃圾到温度、从蒸汽到蒸汽机,最终发电,成为我们每天使用的能源。


现实情况是垃圾不够烧。电网需要稳定供电,所以垃圾焚烧企业的驱动力是如何把垃圾烧得足够好,把其中的每一点热值都转化为能源。这意味着他们会收各种垃圾回来烧。


但由于我国的垃圾分类不够严格,大部分垃圾是混在一起焚烧的。比如厨余垃圾热值很低,建材垃圾热值较高。每天投入焚烧炉的垃圾重量相同,但热值波动很大。


对企业来说,痛点就是如何根据每天波动的热值情况组织和控制燃烧过程,让垃圾烧尽、烧透,转化为更多能源。垃圾焚烧只是发电流程中的一个工段,但在这个工段有大量操作员、能源管理员、安全员等人员参与,四班三倒,人力密集。


因此行业的核心问题有两个:一是能不能减少人工依赖,把人的工时解放出来;二是能不能把有限的垃圾更高效地转化为能源


客户找到我们后,我们会带着燃烧方向的时序大模型 G1 的版本去现场作为基线模型,再根据少量新增数据进行参数适配和微调,以符合实际工况。因为不同场景的参数范围不同,不能直接套用原始模型。比如我们之前做天然气、煤气燃烧,原料稳定;但垃圾燃烧原料波动大,需要额外调整。


虽然团队没有垃圾焚烧的生产经验,但在三个月不到的时间里,我们的第一个 AI 工人就已经上岗,并且稳定运行。这里的「工人」指的就是 AI agent,它能应对常规工况,也能处理临时应急情况。原先需要四位师傅轮班的岗位,现在由一个 Agent 全天候值守。客户称之为「无人值守」,但我们更愿意称为「数字工人在值守」。


目前 agent 的在线率达到 99.9% 以上,几乎不需要人类干预。因为它不会休息、不会分心,焚烧效率更高。一吨垃圾产生的主蒸汽流量提升了 5%,在工业领域这是非常大的提升。


按发电量和上网电价折算,一年能为客户增加 400~500 万人民币收入。除了减少人工,这还给客户带来了额外的收益,所以合作非常愉快,他们也进行了复购,购买更多的数字工人逐步覆盖各个岗位。



(极峰科技智能体模仿人类工人思考的过程,中间为专家知识储备,左右为从信息获取到决策输出的过程)


👩🏻 Ronghui


你刚说的 4 个工人,是不是意味着你们的一个数字工人替代了 4 个?


👦🏻 王筱圃


对。连续型生产是全天候的,需要人工换班,通常一个岗位需要 3~4 个师傅接力。但数字工人不需要换班,就可以完全覆盖。


👩🏻 Ronghui


你们观察过那些老师傅,看你们数字工人工作的反应吗?


👦🏻 王筱圃


我们观察过。技术工人有一定的专业认知,他们会像师傅评价徒弟一样,对数字工人做出专业评价。


记得在一家化工厂,我们还处于「影子陪跑」阶段,数字工人处于实习期,需要验证决策。我们有个小伙伴背景是计算机专业,不懂化工生产,他只是去现场调试影子陪跑的终端 GPU。但在客户眼中,他是我们公司的代表,就是数字工人的「老板」。


有一次,老师傅直接找他操作,说“你们不是很厉害吗?你来弄”。他当时非常紧张,因为化工生产设备造价高、涉及安全。但我们相信自己的产品,相信 agent 的决策能保证生产安全和稳定。于是他坐上操作台,用自己的手根据 agent 的推理结果操作设备,连续四个小时不喝水、不上厕所,紧张到整个人僵住。


一开始,老师傅还在他身后监督,担心出问题。后来老师傅出去抽烟,我们的小伙伴悄悄在内部沟通软件上说:“师傅走了,就我一个人,我好害怕。”我们安慰他说“别慌,稳住”。四个小时后,他顺利换班交接。


这件事很有意思,也让我们感受到,老师傅对数字工人的检验就是最严苛的测试。获得他们的信任后,他们往往会非常支持我们。



(极峰科技AI Agent操作工在垃圾焚烧厂客户应用现场 - 桌上中间的屏幕为AI技术工人操作界面)


👩🏻 Ronghui


我想问一个关于销售的问题。你们卖数字工人,会和传统的 toB 产品销售方式有什么不同?我了解到一些 toB 公司,通常是先找到关键的决策人,对方会给一个试验田,你先做出结果,再一点点推动。你们是怎么做的?在 AI 时代,把数字工人卖给工业企业,销售方式会有什么变化?


👦🏻 王筱圃


我认为会有很大变化。不仅是数字工人,智能体这种产品形态在 toB 销售上都会带来商业模式的改变。这和产品的技术边界、形态以及服务方式密切相关。


之前有一个概念叫 RaaS(Result as a Service),即结果即服务。比如帮你生成一个 PPT、图片或视频,你觉得结果符合预期,就付费。这种场景验证很快。但在工业领域,结果的评估要复杂得多。


比如工艺优化产品或设备,如何严格论证它带来了多少节能或产能提升?客户付费时需要有科学的因果论证。但现实中结果往往有多重原因,比如产能提升可能是因为买了更好的原材料,而不是完全来自我们的产品。


所以 RaaS 在工业场景中落地很难。我们在商业模式上更接近「用工逻辑」。人类工人是按月发工资,只要在岗,满足岗位 KPI,就支付工资。映射到数字工人,就是「在线服务的时间」。这一点是绝对的、不可否认的。数字工人在岗,我们就可以收取工时费用。


而且数字工人的工资一定低于替代的 3-4 个工人的总工资,企业在财务上很容易接受。这种逻辑既保证了客户的成本可控,也让供应商能持续收回收益,因此更容易落地。


👩🏻 Ronghui


你觉得这种模式会被行业广泛采纳吗?


👦🏻 王筱圃


我认为会。因为对客户来说,前期投入低,风险小,不需要一上来就投 100、200 万去改造系统再等结果。而对我们供应商来说,又能保证稳定的持续收益。这是客户和供应商之间的平衡点。如果能大规模推广,会成为行业共识。


👦🏻 Koji


现在有竞品吗?


👦🏻 王筱圃


实际上是竞品,但形态各有不同。比如传统的工业自动化企业,大家熟悉的西门子、霍尼韦尔、施耐德,以及国内响当当的浙大中控和利时,这些企业在工业自动化领域已经深耕多年,是很多技术的先驱,也在寻求技术演进和产品功能迭代。


在他们看来,他们提供的工业过程管理和控制解决方案,更多是以高级过程控制技术为主导的一种模式,产品逻辑不同。他们的目标是让电气自动化控制更自动化、更精确、更高效,而不是复刻一个人。他们管理的界面就是原先自动化覆盖的界面,这是一套完整的解决方案。


另一种是大家熟悉的华为云、阿里云这种通用场景平台型玩家。以华为为例,在面向工业提供整体解决方案时,不仅有盘古大模型,还有昇腾计算平台的 S 层改造。我既可以卖计算设施,也可以卖盘古大模型的研发平台,再根据你的实际应用做共建,或引入生态合作伙伴帮你做。不仅做生产过程管理和控制,还做企业经营管理优化,提供全套服务。


对于企业来说,如果要做基于大模型技术驱动的整体智能化改造,尤其是工厂客户,选择这种路径更好。从影响力和技术覆盖面来说,优势明显。但如果只是解决车间内的某个问题,定向、垂直地去做,那选择我们会更快,性价比更高,投入产出比更好,收益更快。


第三类是我们遇到过的大模型 agent,包括初创公司。例如阶跃星辰、转型的第四范式,以及行业里响当当的 MiniMax、智谱清言。我们不认为他们是同一战场的竞争对手,因为他们使用的是通用 agent 平台,为企业经营管理赋能。


👦🏻 Koji


那企业可以采纳他们,也可以采纳你们?


👦🏻 王筱圃


要看你解决哪个问题。如果是办公层面的集团经营管理优化,比如供应链优化、工业设计优化、知识库构建,这些偏向通用 agent 供应商会更具优势,这是车间外的事。


如果要解决车间内的事,我们的产品能解决他们解决不了的问题。因为要直接与产线互动,与电气自动化和设备打交道,agent 平台影响的是生产过程的管理和控制。这时客户当然会选择我们的产品。因为那些产品解决不了,所以这是界面错位问题。不能说是竞品,只能说是共同在这个方向努力的供应商。


未来呢?AI 会带来工业革命级别的改变吗?


👩🏻 Ronghui


接下来你们所在的领域,工作方式可能会发生哪些根本性的变化?


👦🏻 王筱圃


我们讲整个生产流程的重组。我觉得我们的产品会带来一个非常大的改变。原先车间内的分工很明确:工艺专家负责设计,工艺技术工人负责管理和控制生产过程,机器负责自动化执行,这是传统的生产组织形式。


如果数字工人能够嵌入这种生产局面,未来生产组织形式会发生很大改变。原先需要工人每天机械性、重复性、高注意力完成的动态管理和控制过程,会由数字工人接管。


人类工人的岗位会被重新定义,从简单的管理人员、操作人员变成设计者、监督者和创新者。这是一个非常大的转变。技术工人本来就稀缺,他们会被放在更需要创造性的岗位上,为产业带来非常大的改变。


比如我们有一个客户是做危废处置的。危废是工业生产过程中产生的有污染、有危险性的废弃物,包括医疗污染物如床单、针头等,需要被处置。有的直接销毁,有的作为原料生产其他东西。这个客户会从危险废物中提取元素,做元素重组,生产产品。本来他们主要生产氨水,但近期碘的价格很高,市场需求大,他们就想生产碘。


要做到这一点,需要技术工人研究如何从危废中提取碘,并购买设备组成产线,生产出来。如果没有人类工人参与,就会错失这个风口,失去利润。但如果人类工人被解放出来,作为专家投入研发过程,企业的增量收益非常可观。这是一个局部的改变。


更大的层面是:今天我们讲一个数字工人在一个工位上工作,明天如果我们继续研发下去,多 agent 协同成为可能,更多数字工人在工厂中有效协同,覆盖面会越来越广。


未来如果在工业网络安全和生产安全有保障的前提下,一个产业链的上下游由数字工人串联,它的响应过程会更快。比如终端销售需要某个产品,上游每一个生产工厂就能及时调整生产计划和产能,加强生产。这种串联带来的改变,可能就是工业革命级别的改变。



👩🏻 Ronghui


那你觉得大学生在这个领域该学些什么?


👦🏻 王筱圃


其实我觉得国家的教育体系已经有非常快速的响应。我们之前常去很多高校沟通,发现国家在高等教育的课程设置上有很大创新性。比如化工开设了一个新的学科方向——智能化工。学生不仅学习化工工艺知识,还学习大数据和人工智能技术,把这些技术结合到工艺设计、产线设计、设备设计以及生产过程的管理和控制中。


这样学生学习的是综合性、跨学科的知识。未来进入工作岗位,他们就像现在的软件开发工程师一样。我们的软件开发同事已经大量使用代码 Copilot,甚至部分代码生成工具。同样地,工业技术工人未来也会逐渐学会使用数字工人这种大模型产品,来帮助他们完成日常工作,协助并解放他们。我认为这是未来的发展趋势。


👦🏻 Koji


如果在听我们节目的高中朋友,或者你的小孩在读高中的朋友,在填志愿时可以多留心看看:今天有一些学科已经和 AI 结合得很紧密。多考虑去更先进的学校学习,你可能就能比别人更早接触到 AI 和未来。


👩🏻 Ronghui


说个人一点,如果你今天时光穿越,已经知道未来发生的事情,回到过去读大学的时候,在中科大读书的你,会要求自己做出什么最大的改变?或者说,你穿越回去,一定要告诉当时的自己做哪一件事?


👦🏻 王筱圃


我觉得现在作为创业者,在公司里不仅做技术研发和管理,还要做整个企业的运营管理。作为一个 CEO,一个非常重要的能力就是会提需求、会描述需求、会细化需求。这点无论是使用大模型要写 prompt,还是给员工布置工作,都需要具备。这种能力最好从上学时就开始培养。


在做研究之前,在想要得到结果之前,要能描述清楚事情本质上的需求是什么,洞察它的第一性原理。我认为这是所有年轻人未来都要具备的。


👩🏻 Ronghui


最后一个问题,你觉得这次创业对你以后的工作,或者更大一点到生活,在 AI 这个时代,有什么新的思考?


👦🏻 王筱圃


首先是对行业的思考有一些变化。原先我们做了很长时间的工业信息化、数字化产品和项目。在这个过程中,我们对行业客户的认知是:带来一个全新的产品,让客户去适应、学习和使用。但这个过程会有困难,尤其是大 B 端客户,会存在认知壁垒或认知门槛,所以过程并不顺利。


但这次创业之后,我发现 agent 产品形态相对灵活。在流程配置、功能配置,以及作为思考中枢的泛化性和模型的适应性方面,都比上一个时代的信息化软件更好。在这个基础上,产品逻辑要转变,不是客户适应产品,而是产品去适应客户,融入客户本身的专业工作流程


这也是我们做 B 端产品这些年看到的趋势,尤其 agent 产品更是如此。未来我们和客户的关系不再是简单的甲乙方关系,而是一种共生关系。产品越用越贴合工作实际,越用越好用。这是我在创业过程中对行业认知上的一个比较大变化。


对我个人来说,第一次创业时,很多前辈告诉我,初创团队的优势是深耕一个行业,做透,形成高壁垒,让大企业无法威胁你的产品公司。但在实践中我发现,垂直领域的专注当然必须,但不能只 focus 在一个行业。否则会受行业发展规律影响。比如长期服务 A 行业,如果 A 行业不好了,公司抗风险能力就很差。


所以在专注于一种场景问题的同时,要利用大模型和 agent 产品的能力,在相同工艺、但不同行业和场景中保持泛化和灵活性。我觉得这对 toB 的 agent 企业,尤其是初创企业,是一个新的认知。挑对行业很重要,但不能只扎在一个行业不出来,不去看别的。agent 产品或者基于大模型的产品逻辑,本身就应该以泛化能力作为优势。


👦🏻 Koji


像当年温家宝来到北航给学生题词:“脚踏实地,仰望星空。


👦🏻 王筱圃


对,这也是一种能力。


另外一个方面是接纳更多 agent 产品。比如我们公司售前团队、产品设计团队,从 Canva 到 Figma,再到各种 AI 插件,我们其实是全盘接纳的。硅谷经常说“一人公司”,一个人做很多岗位。对我们 20 多人的团队来说也是如此,大家都要是多面手。


在售前、产品设计、技术研发、公司管理等方面,大家都在疯狂使用各种探索性产品,包括 agent 产品。所以我觉得未来企业的组织形式肯定会不一样,不再是明确的岗位分工,而是有模糊的边界。这在企业管理上也会带来新的思路。暂时就这么多。


👦🏻 Koji


谢谢筱圃的分享,欢迎下次再来「十字路口」。


👦🏻 王筱圃


好的,谢谢邀请。


附录:



极峰科技AI Agent 操作工在合成化工客户现场应用



极峰科技AI Agent 工艺专家在乙醇制备行业产品应用



极峰科技AI Agent 操作专家在燃烧场景应用



文章来自于微信公众号 “十字路口Crossing”,作者 “十字路口”

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!