AI热点 1天前 107 阅读 0 评论

MIT华人辍学生22岁拿下2100万美元,录个屏就能生成AI员工

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章


你有没有发现一个奇怪的现象?AI现在可以帮你生成音乐,把自拍照变成文艺复兴风格的肖像画,甚至能帮你预订晚餐。但如果你让它处理发票对账、订单录入或者文件验证,它就开始抓瞎了,最后这些活还是得靠某个打开了15个浏览器标签页、有着超强耐心的员工来完成。这种巨大的反差让我开始思考:为什么AI在创意领域表现得如此出色,却在最基础的重复性工作上束手无策?


我发现这个问题的答案其实很简单,也很深刻。我们正处在现代工作史上最重大的转变之一。虽然AI每天都在刷新头条,但大部分公众讨论都围绕着创意工具和知识工作,而真正最有意义的AI应用浪潮正在其他地方悄然发生:在那些被软件遗忘的传统行业的运营核心,在那些几十年来一直依靠人工处理的重复性工作中。这些工作包括理赔处理、数据录入、合规审查、文档验证等等,虽然关键但不够光鲜的业务流程。多年来,这些工作被外包给大规模的海外团队,打包成业务流程外包服务,分割孤立,通过人工努力拼接在一起。


就在这个时候,一家名为Sola的初创公司悄然获得了2100万美元的融资,其中包括由Andreessen Horowitz领投的1750万美元A轮融资。这家公司的联合创始人兼CEO Jessica Wu只有22岁,她和23岁的联合创始人兼CTO Neil Deshmukh都是MIT的辍学生。但别被他们的年龄迷惑了,他们正在解决一个价值数千亿美元的问题:如何让AI真正在企业后台运营中发挥作用。更有趣的是,这轮融资的关键决策者都是女性:Andreessen Horowitz的合伙人Kimberly Tan、Conviction的创始人Sarah Guo,以及Jessica Wu本人。这在AI领域的融资中是极其罕见的现象,正如Wu所说:"当你创建一家初创公司时,你身边并没有太多女性。"


为什么传统自动化工具都失败了


要理解Sola为什么重要,我们首先需要明白为什么之前的自动化尝试都以失败告终。传统的企业自动化,特别是机器人流程自动化(RPA),在理论上听起来很完美:既然很多工作都是单调重复的,公司里最了解哪些工作浪费时间的人就是领域专家和操作人员自己,那么构建这些自动化的最佳人选应该就是操作人员——也就是所谓的"公民开发者"。这些非技术用户理解并亲身体验这些工作,为自己构建自动化工具应该是最自然的选择。


但现实情况是,这一代的工具根本没有按照这种方式工作。企业在顾问身上花费了数千万美元,建立了"卓越中心"来集中这些努力,这掩盖了一个事实:这些工具需要受过专业训练的人员才能使用,即使在最好的情况下也极其脆弱。我在多个企业见过这样的场景:IT团队花费几个月时间设置复杂的RPA流程,但只要目标网站稍微改动一个按钮位置或者修改一个表单字段,整个自动化系统就会崩溃。更糟糕的是,修复这些问题往往需要重新编程,而操作人员根本无法自己处理,必须再次依赖IT团队或外部顾问。



这种脆弱性的根本原因在于传统RPA的技术架构。它们基本上就是预先编程的脚本,严格按照预定义的步骤执行操作。如果界面发生任何变化,脚本就会失效。这就像给一个盲人详细描述如何从A点走到B点,但如果路上有任何障碍物或者路径发生变化,他就会迷路。传统RPA缺乏适应性和智能,无法理解操作的上下文和意图,只能机械地重复预设的动作序列。


另一个问题是实施成本和时间。正如Wu所说的,传统RPA"需要数百名顾问介入,运行在1990年代的软件上,经常出现故障"。我见过一些企业的RPA项目,从需求分析到最终部署需要6-12个月的时间,成本动辄数百万美元。而且这还只是开始,后续的维护和更新成本往往比初始投资还要高。这种高成本、长周期的特点使得RPA只能应用于最大规模、最标准化的流程,大量中小规模但同样重要的重复性工作仍然无法得到自动化。


更严重的是,传统RPA创造了新的孤岛效应。虽然它们自动化了某些特定流程,但无法在不同系统和平台之间灵活地协调工作。企业最终得到的是一堆相互独立的自动化脚本,每个脚本只能处理非常特定的任务,无法适应业务流程的变化或处理异常情况。这导致了一个悖论:自动化工具本身变成了需要大量人工维护的复杂系统。


Sola的革命性方法:让AI真正理解工作


Sola的方法从根本上不同于传统RPA。它是一个基于AI agent的流程自动化平台,让企业能够在任何应用程序中自动化工作流程,无需编码,无需顾问,也无需替换现有系统。最关键的是,团队只需记录一次流程,Sola就能将其转化为一个能够自主运行、适应和改进的AI agent,以我们人类的方式与屏幕和平台交互。


这种方法的革命性在于它模拟了人类的工作方式,而不是试图将人类工作强行适配到机器逻辑中。当你让一个员工学习新的工作流程时,你不会给他一套严格的指令说"点击坐标X,Y",而是会说"找到提交按钮并点击它"。员工能够理解这个意图,即使按钮的位置发生了变化,他们也能找到并完成任务。Sola的AI agent正是以这种方式工作的——它理解任务的意图和目标,而不仅仅是执行预设的动作序列。



从技术角度来看,Sola利用了计算机视觉和视觉语言模型的最新突破。正如Sarah Guo在她的投资说明中指出的:"计算机使用和视觉语言模型正在改变游戏规则。我们第一次可以构建像人类一样推理和行动的机器人系统:它们可以恢复并响应网站变化,对输入变化具有鲁棒性,并且可以可靠地处理数千个输入。"这意味着Sola的AI agent不仅能看懂屏幕内容,还能理解上下文,做出智能决策,并在遇到变化时自动调整策略。


更重要的是,Sola将复杂的AI技术包装在了一个直观易用的界面中。用户只需要通过Sola的浏览器扩展记录一次他们的工作流程,系统就会自动生成一个持续运行的、可适应的AI agent。这个agent通过流程图界面进行可视化,客户可以编辑和管理,这使得他们能够在几个小时内而不是几个月内创建产生实际价值的agent。正如Kimberly Tan所说:"产品的简洁界面抽象掉了让这些agent工作所需的巨大技术复杂性。"


这种设计哲学的核心是赋能真正了解工作的人。Sola不是为IT部门或技术团队设计的,而是为那些每天实际执行这些工作的人设计的:分析师、合规主管、运营经理、计费团队。正如Sarah Guo所说:"这个领域的大多数工具都需要工程师来设置和维护。Sola的独特之处在于,实际做工作的人——像运营分析师或合规主管这样的主题专家——可以自己构建和扩展自动化。这就是真正的大规模AI采用的样子。"


从实际应用来看,Sola已经在帮助各种规模的企业解决真实的业务问题。物流公司可以在几小时内自动化数千次货运更新;律师事务所可以处理大量复杂的文件归档,而无需联系IT部门;医疗保健提供商可以自动、准确地协调完全不相关系统之间的计费,没有延迟。这些不是试点项目或原型,而是正在生产环境中运行的真实工作流程,每天处理实际的业务流程。


成功案例:AI改变传统行业的具体方式


要真正理解Sola的影响力,我们需要看看它在传统行业中的具体应用。物流行业就是一个很好的例子。这个行业仍然严重依赖人工流程,大量的工作涉及在不同的在线门户网站之间复制粘贴信息,手动更新货运状态,以及在各种不兼容的系统之间协调数据。一个典型的物流公司可能需要员工每天在十几个不同的网站上查看货运信息,然后手动将这些信息输入到他们的主要管理系统中。


使用Sola之后,这些繁琐的工作完全自动化了。AI agent可以24小时不间断地监控各个货运门户网站,提取更新信息,并自动同步到公司的核心系统中。更重要的是,当这些第三方网站更新界面或改变数据格式时,Sola的AI agent能够自动适应这些变化,而不需要人工干预或重新编程。这种适应性是传统RPA无法提供的。



在医疗保健行业,Sola正在解决一个更加复杂的问题:不同系统之间的计费对账。医疗保健提供商通常需要在保险公司系统、政府门户网站、内部计费系统和患者记录系统之间协调信息。这些系统往往完全不相关,使用不同的数据格式和工作流程。传统上,这需要专门的计费专员花费大量时间手动匹配和验证信息。Sola的AI agent能够理解每个系统的逻辑和要求,自动执行复杂的对账流程,确保准确性并大大减少处理时间。



法律行业的应用也很有启发性。律师事务所需要处理大量的法庭文件归档,每个文件都有特定的格式要求和截止日期。传统的做法是让律师助理或初级律师手动准备和提交这些文件,这不仅费时费力,而且容易出错。Sola的AI agent可以理解不同法院的归档要求,自动格式化文件,填写必要的表格,并在适当的时间提交文件。这让法律专业人员能够专注于更高价值的法律分析工作,而不是陷入繁琐的行政程序中。


在金融服务领域,Sola正在帮助处理发票对账和费用管理等核心后台流程。传统的发票处理涉及多个步骤:接收发票、验证供应商信息、匹配采购订单、检查预算批准、录入会计系统,最后安排付款。每个步骤都可能涉及不同的系统和人员,创造了大量的手动协调工作。Sola的AI agent能够端到端地处理整个流程,从扫描发票内容到最终记账,都能自动完成,同时确保符合公司的财务政策和合规要求。



客户的反馈证实了这种影响的深度。正如投资者Kimberly Tan所观察的:"客户一致表示,Sola是他们见过的第一个立即看到投资回报率的AI产品,他们已经能够减少BPO成本或将内部团队重新分配到更具战略性的工作上。"这种立即的价值创造是Sola与其他AI工具的重要区别。许多企业AI工具需要长期的培训和适应期才能显示价值,但Sola的影响是即时和可测量的。



技术创新的深层逻辑:为什么现在可以做到


Sola能够成功的关键在于它准确地把握了AI技术发展的时机。虽然计算机视觉和自然语言处理技术已经存在多年,但直到最近,这些技术才达到了能够可靠处理复杂企业工作流程的成熟度。正如Sarah Guo所指出的,虽然一些工具如Operator或CUA已经展示了计算机自动化的可能性,但它们"在个别任务上几乎不可靠,更不用说在真实世界自动化用例常见的数十万规模上"。它们仍然缓慢,对非技术最终用户来说缺乏正确的抽象和产品界面。


Sola的技术优势在于它结合了最先进的AI研究和深度的客户理解。Neil Deshmukh在MIT-IBM Watson和Quest for Intelligence Lab的深度AI研究背景,为平台提供了强大的技术基础。但技术实力只是成功的一半,另一半是对客户需求的深刻理解和产品设计能力。这种组合正是传统企业软件公司往往缺乏的:它们要么有强大的技术但不理解客户需求,要么理解客户但技术能力不足。


从产品设计角度来看,Sola的成功在于它创造了正确的抽象层。大多数AI工具要么过于复杂,需要技术专家才能使用,要么过于简化,无法处理真实世界的复杂性。Sola找到了一个甜蜜点:足够简单,让领域专家可以自己使用;足够强大,可以处理复杂的企业工作流程。这种平衡需要深入理解用户的心智模型和工作方式,这正是Jessica Wu在Citadel和Thrive Capital的工作经验所提供的洞察。



另一个关键因素是Sola对边缘情况和异常处理的重视。在真实的企业环境中,标准流程只能覆盖80%的情况,剩下的20%往往是各种边缘情况和异常。传统RPA在遇到这些情况时就会失败,需要人工干预。Sola的AI agent通过深度学习和上下文理解,能够处理大部分这些边缘情况,并且当遇到真正无法处理的情况时,能够智能地标记并寻求人工帮助,而不是简单地崩溃。


从技术架构角度看,Sola采用了模块化和可扩展的设计。不同于传统RPA的单一脚本方法,Sola的每个工作流程都由多个可复用的组件组成,这些组件可以在不同的上下文中重新组合和调整。这种架构使得系统能够随着客户需求的变化而进化,而不需要从头开始重建。这也解释了为什么Sola的客户能够不断发现新的用例并扩展平台的应用范围。


最重要的是,Sola认识到企业自动化不仅仅是技术问题,更是组织和文化问题。成功的自动化需要改变人们的工作方式和思维模式。Sola通过让实际执行工作的人成为自动化的创建者和管理者,确保了自动化工具真正符合实际需求,并且能够得到组织内部的支持和采用。这种自下而上的方法比传统的IT主导的自上而下方法更有效,因为它确保了自动化工具真正解决了实际问题,而不是IT部门认为应该解决的问题。


投资背后的逻辑:为什么顶级VC抢着投资


Sola获得的2100万美元融资不仅仅是对技术的认可,更是对其商业模式和市场时机的验证。Andreessen Horowitz的Kimberly Tan在解释投资决策时说:"Jessica和Neil拥有技术深度、产品直觉和客户同理心的罕见组合。通过Sola,他们构建了一个优雅的、AI原生的平台,为企业提供真正的自动化——远远超越了传统RPA的限制。"这种评价反映了投资者对团队综合能力的高度认可。



从市场规模角度看,企业后台自动化是一个巨大的市场机会。传统的业务流程外包(BPO)市场价值数千亿美元,而大部分这些外包工作本质上都是可以被AI自动化的重复性任务。Sola不是在创造一个新市场,而是在用更高效的解决方案替代现有的低效方案。这种替代型创新往往比创造型创新更容易获得客户采用,因为客户已经在为这些问题付费,他们只是在寻找更好的解决方案。


投资者特别看重的是Sola的增长指标。据报道,自年初以来,Sola的收入增长了五倍,工作流程量每月翻一番,这种增长是由客户不断发现新用例的病毒式采用推动的。这种增长模式表明Sola不仅解决了客户的即时痛点,还为他们创造了持续的价值,促使他们扩大使用范围。这种有机增长比通过营销和销售推动的增长更可持续,也更有价值。


Conviction的Sarah Guo在投资说明中强调了团队的执行能力:"Jessica和Neil独特地有才华,独特地坚定。"她描述了创始人的专注程度:他们在旧金山Golden Gate Park附近住了整个夏天,但因为太专注于工作,甚至不知道如何导航到公园。这种极致的专注和执行力在创业成功中往往比技术能力更重要。投资者看重的不仅是团队能够构建出色的产品,还有他们能够持续迭代和改进,直到找到产品市场匹配。


另一个吸引投资者的因素是Sola在传统行业中的成功。许多AI公司专注于科技行业或其他早期采用者,但Sola正在服务物流、医疗保健、法律等传统行业的客户。这些行业通常更难进入,但一旦成功,客户粘性更高,支付意愿更强。正如Jessica Wu所说:"为了服务所有这些与你自己的经验或技术理解不同的人,你真的必须既有产品愿景,又有很多同理心和团结人们支持你的能力。"这种跨行业的成功能力是许多AI公司缺乏的。


从竞争格局来看,虽然企业自动化是一个拥挤的领域,但Sola的方法是独特的。传统RPA公司如UiPath面临着技术债务和架构限制,难以适应AI时代的要求。新兴的AI自动化公司往往专注于特定垂直领域或技术用户,缺乏Sola的通用性和易用性。这给了Sola一个独特的市场定位:既有最先进的AI技术,又有传统企业能够接受和使用的产品形态。


投资的时机也很关键。企业对AI的态度正在从谨慎观望转向积极尝试,但他们需要的是能够快速显示价值的实用工具,而不是复杂的技术实验。Sola正好满足了这种需求:它让企业能够在不改变现有IT基础设施的情况下,快速部署AI自动化解决方案。这种渐进式创新比颠覆式创新更容易被传统企业接受,也更有可能获得大规模采用。


我对企业AI未来的深度思考


看到Sola的成功,我开始重新思考企业AI的发展方向。长期以来,我们一直被告知AI将在知识工作和创意领域产生最大影响,但Sola的例子表明,真正的价值可能在于那些看似平凡但关键的后台操作。这种洞察有着深刻的含义:也许我们一直在寻找错误的地方来应用AI。


从技术发展的角度来看,我认为我们正在见证从"AI作为助手"到"AI作为员工"的转变。传统的AI工具,如ChatGPT或GitHub Copilot,主要是增强人类的能力,帮助我们更好地完成工作。但像Sola这样的AI agent则不同,它们实际上在执行工作,而不仅仅是协助工作。这种转变标志着AI应用的一个重要里程碑:从辅助工具变成了独立的工作单元。


这种转变对企业组织结构和工作方式有着深远的影响。当AI能够独立执行许多重复性任务时,人类员工就可以专注于更高价值的活动:战略思考、创新、客户关系管理等。这不是简单的人员替代,而是工作重新分配。我预测,未来的企业将由人类员工和AI agent组成的混合团队运营,每个都专注于自己最擅长的任务。


从商业模式角度来看,Sola代表了一种新的AI商业化路径。许多AI公司试图构建通用的AI平台或专门的AI应用,但Sola选择了一条中间道路:构建一个特定用途(企业自动化)的通用平台。这种方法的优势在于它足够专注,可以在特定领域做到最好,同时又足够通用,可以跨行业和用例扩展。我认为这种方法将成为企业AI的主流模式。



我也注意到Sola成功的一个重要因素是它对"公民开发者"概念的重新定义。传统的公民开发者概念假设非技术用户可以学习使用复杂的开发工具,但现实证明这很困难。Sola的做法是让AI成为"开发者",而人类只需要演示和指导。这种角色转换更符合人类的自然工作方式,也更有可能被广泛采用。


从更广泛的AI发展趋势来看,我认为Sola的成功预示着AI应用的一个重要方向:从追求通用人工智能(AGI)转向构建特定领域的超级智能代理。虽然AGI仍然是一个长期目标,但像Sola这样专注于特定问题的AI agent可能更快地创造实际价值。这种方法也更容易获得监管批准和用户信任,因为其行为更可预测和可控。


我特别关注的是Sola对传统行业的影响。这些行业往往变化缓慢,对新技术持谨慎态度,但一旦接受新技术,通常会带来巨大的效率提升。Sola在物流、医疗保健、法律等行业的成功,可能会催化这些行业的整体数字化转型。我预测,未来几年我们将看到这些传统行业在AI应用方面出现爆发式增长。


从投资和创业角度来看,Sola的案例表明,最成功的AI公司可能不是那些拥有最先进技术的公司,而是那些能够将AI技术与深度的行业理解和出色的产品设计相结合的公司。这需要跨学科的团队和长期的客户关系建设,这可能会提高新入者的门槛,但也会为成功者创造更大的护城河。


我也思考了Sola模式的潜在限制和挑战。虽然AI agent在处理结构化和半结构化任务方面表现出色,但在需要创造性判断、复杂决策或人际交往的任务上仍然有限。此外,随着越来越多的企业采用AI自动化,竞争优势可能会逐渐消失,迫使企业寻找新的差异化来源。这种动态可能会推动AI技术的持续快速发展。


最后,我认为Sola的成功也提出了一些重要的社会和经济问题。当AI能够执行越来越多的工作任务时,我们如何确保技术进步带来的好处能够公平分配?如何帮助那些工作被自动化的员工转型到新的角色?这些问题需要企业、政府和社会的共同努力来解决。


总的来说,我认为Sola代表了企业AI发展的一个重要转折点。它证明了AI可以在传统企业环境中创造真实、可测量的价值,而不仅仅是技术展示。这种成功可能会激励更多的企业投资AI自动化,加速整个行业的数字化转型。对于那些仍在观望的企业来说,Sola的例子表明,AI自动化已经从实验阶段进入了实用阶段,现在是开始行动的时候了。


结尾


一家处于 stealth 状态的 AI 初创公司,已获得头部一线美元基金的种子轮投资,正在招募founding team成员,以下是岗位JD,感兴趣的朋友欢迎扫码投递简历。其中海外运营增长的岗位,只有两个要求:聪明和英语好,我会手把手教。



文章来自于微信公众号“深思圈”,作者是“Leo”。


作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!