AI热点 4小时前 184 阅读 0 评论

企业级Web Agent来了,华人团队融资4700万美元,让AI替企业"搬砖"赚大钱

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章


你有没有想过,网络其实已经完全超出了人类的处理能力?想象一下,一个企业每天需要跟踪数千个网站上的价格变化、库存更新、竞争对手动态,这些数据每分钟都在发生变化,传统的浏览器和人工操作根本无法应对。当我看到TinyFish刚刚完成4700万美元A轮融资的消息时,我意识到这不仅是一轮融资,而是一个全新时代的开始——企业级Web Agent时代。我一直在思考AI agent的商业化应用,但TinyFish的方法让我看到了一个更加现实且具有颠覆性的方向:让AI agent不是简单地模拟人类浏览网页,而是以企业级的规模、可靠性和合规性要求来执行复杂的业务工作流程。


这轮由ICONIQ Capital领投的融资,吸引了USVP、Mango Capital、MongoDB Ventures和Sandberg Bernthal Venture Partners等知名投资机构的参与。特别值得注意的是,Sandberg Bernthal Venture Partners是由前Meta高管Sheryl Sandberg联合创立的基金,她的参与为这个项目增添了重要的战略价值。但真正让我感兴趣的不是融资本身,而是TinyFish已经在Google、DoorDash、ClassPass等财富500强公司的生产环境中大规模部署,每月运行数百万次操作。这意味着他们已经跨越了从demo到真实商业价值的鸿沟,这在AI agent领域是极其罕见的成就。


创始人团队的背景也很引人注目,体现了技术深度和商业洞察的完美结合。CEO Sudheesh Nair曾是Nutanix的总裁,拥有丰富的企业级产品开发和市场推广经验。联合创始人Shuhao Zhang是前Meta工程师,曾参与GraphQL的开发工作,在大规模系统构建方面有着深厚的技术积累。另一位联合创始人Keith Zhai则是前华尔街日报的资深记者,他的媒体背景为团队带来了独特的信息获取和分析视角。这种技术、商业和媒体经验的三重结合,为他们打造了一个独特的视角来理解和解决企业在网络自动化方面的真实需求。正如Shuhao在访谈中提到的,建设一个公司时"营销和定位确实是最困难的部分",而Keith的媒体背景正好补强了这一短板。


从AgentQL到企业级Web Agent的技术演进


了解TinyFish的发展历程让我对他们的技术积累有了更深的认识。这家公司其实已经默默耕耘了20个月,虽然直到现在才正式走出隐秘模式。他们的第一个产品AgentQL为企业级Web Agent奠定了重要的技术基础。AgentQL解决了一个长期困扰开发者的问题:如何让AI agent能够准确地识别和操作网页元素。


Shuhao Zhang在开发AgentQL时观察到一个重要趋势:"20个月前我确实看到了向更具代理性世界的趋势和转变。那时仍然是GPT-3.5,但真正看到了推理能力和处理复杂任务的能力。所以真正缺失的是AI agent访问网络的更AI原生方式。"这个洞察非常关键。传统的网页自动化工具依赖CSS选择器或XPath,这些方法在面对动态生成的类名、不断变化的页面结构时经常失效。而AgentQL允许开发者使用自然语言来描述页面元素,比如"红色的提交按钮"或"标题为特定内容的卡片"。



我特别欣赏AgentQL在技术架构上的设计决策。它选择基于DOM而不是截图来分析页面,这个决定背后有深刻的技术考量。Shuhao解释说:"语言模型的训练数据集中HTML和DOM的数据比图像多得多。而且截图还有物理限制,当你有长页面、水平垂直滚动、隐藏在折叠面板后的内容时,截图方式存在一整套限制。"这种技术选择体现了团队对AI模型能力边界的深刻理解。


AgentQL的成功为TinyFish奠定了重要基础。它已经被集成到LangChain、LlamaIndex和LFlow等主要AI框架中,服务数亿次API调用。更重要的是,它在Chrome扩展和开发者工具方面的创新,让开发者能够在实际部署前验证查询的准确性。这种"所见即所得"的开发体验大大降低了使用门槛,也提高了最终部署的可靠性。从AgentQL到企业级Web Agent,TinyFish展现了从底层工具到完整解决方案的技术演进路径。


为什么传统的网络自动化方法已经过时


我在过去几年中观察到一个明显的趋势:网络变得越来越复杂,而我们访问和处理网络数据的方法却停留在十年前。TinyFish在其最新博客中提出了一个深刻的观察:"网络的故事一直是规模的故事。"从最初的几个静态页面,到数百万个可通过Yahoo和Google搜索的网站,再到电商和社交平台,最终整个企业都迁移到了网络上。但问题是,网络的增长速度远远超过了我们处理它的能力。


现在的网络已经变成了一个迷宫。信息隐藏在登录界面后面,内容随着脚本和个性化而变化,价格每分钟都在调整。正如TinyFish所说:"网络已经成为一个迷宫,在人类规模上无法把握。"传统的网络抓取工具和自动化脚本在面对现代网络环境时显得力不从心。网站使用动态加载、反爬虫措施、个性化内容,这些都让传统方法频繁失效。


更重要的是,企业级应用对准确性、稳定性和合规性的要求远远超出了个人用户的需求。TinyFish的创始人Sudheesh Nair对这个问题有着深刻的理解。他指出:"当今的网络横跨数千个平台和数十亿个页面,但公司无法充分挖掘其潜力,因为大规模创造业务价值所需的工作复杂、手动且受人类能力限制。"这个观察非常准确。我见过太多企业花费大量人力来手动收集竞争对手信息、跟踪市场价格、监控库存变化,这些工作不仅效率低下,而且容易出错。



TinyFish在其技术分享中特别强调了现代网络环境的复杂性。Shuhao Zhang提到:"现代网络框架的类名是动态生成的。如果你刷新页面,某些网站会改变一切。内容也是动态的。所以nth-child也会在你有新横幅时改变顺序,轮播会改变。"这种技术细节说明了为什么传统的CSS选择器和XPath方法不再可靠。


我特别认同TinyFish提出的一个观点:网络已经超越了浏览器的能力范围。他们在博客中写道:"创造新机会和收入取决于数千个工作流程在数千个网站上运行,每天有数十亿次变化。没有人类分析师能跟上。消费者工具,那些为个人构建的一次一个浏览器的代理,从来没有被设计来承担这种重量。"现代企业需要的不是更好的浏览器,而是能够理解和适应网络复杂性的智能系统。


TinyFish的企业级Web Agent革命


TinyFish的方法之所以引起我的关注,是因为他们从一开始就明确区分了消费级和企业级Web Agent的根本差异。正如他们在分析中指出的:"企业级Web Agent在根本上不同于消费级浏览器代理。"消费级agent擅长处理个人任务,比如安排旅行行程或基于浏览历史提供个性化推荐,这些都是一对一的简单任务。但企业级Web Agent需要自动化那些必须执行成千上万次甚至数百万次的复杂业务工作流程,而且不能失败。


他们的企业级Web Agent具备几个关键特征,这些特征让我看到了真正的技术突破。首先是结果导向的设计,这些agent不是为了展示技术能力,而是为了实现可衡量的业务结果,比如收入增长、成本节约或市场份额提升。其次是完整的工作流程覆盖,它们能够处理整个流程的每个阶段,而不仅仅是孤立的任务。第三是企业级的可靠性和合规性,这意味着它们能够满足全球大型组织在安全性、治理和正常运行时间方面的要求。


最让我印象深刻的是他们的"行星级规模"能力。TinyFish的Web Agent可以同时在数千个平台上协调行动,这种规模是传统自动化工具无法达到的。想象一下,一个agent能够同时监控全球数千个电商网站的价格变化,实时分析竞争对手的促销策略,并将这些信息整合成可执行的商业洞察。这不仅仅是技术的进步,更是商业智能收集方式的根本性变革。


从技术实现角度来看,TinyFish使用了先进的推理模型来理解和适应网络环境的变化。他们的系统使用先进的AI模型进行推理和探索,然后将这些知识编码化,以实现高速、确定性的大规模执行。这种方法结合了AI的灵活性和传统自动化的可靠性。更重要的是,他们的基础设施能够学习、适应和扩展,这意味着系统会随着使用而变得更加智能和可靠。


我特别欣赏TinyFish在安全性和合规性方面的考虑。企业级应用不能像消费级产品那样承担数据泄露或合规违规的风险。TinyFish的Web Agent内置了企业级的安全态势和治理框架,确保所有操作都有完整的日志记录和审计追踪。正如他们强调的:"TinyFish代理专门设计用于以企业要求的规模、可靠性和合规性运营。"这种对企业需求的深度理解,是他们能够在财富500强公司中成功部署的关键原因。


在技术架构的设计上,TinyFish展现了对现代AI技术的深刻理解。Shuhao Zhang在技术分享中提到:"生成式AI和新发布的推理模型的进步使网络变得更加复杂,传统工具更难访问。"但同样是这些推理模型,为TinyFish的企业Web Agent提供了理解和处理今日网络复杂性的能力,让公司能够安全地扩展其运营,并将复杂性转化为商业优势。



真实商业案例证明价值


理论再好也需要实践验证,而TinyFish在这方面的表现让我印象深刻。他们已经在多个行业的头部企业中实现了大规模部署,这些案例展示了企业级Web Agent的真实商业价值。目前TinyFish运营着数十万个企业级Web Agent,每月为财富500强公司和高增长企业执行数百万次操作,这种规模本身就说明了技术的成熟度和市场需求的真实性。


在酒店业,TinyFish为Google开发的Web Agent解决了一个长期存在的技术挑战。日本有数千家酒店使用老旧的预订系统,这些系统无法与Google的搜索聚合器直接集成。传统解决方案要求这些酒店升级整个IT系统,成本高昂且实施困难。TinyFish的Web Agent能够自动聚合这些酒店的库存信息,让消费者可以通过Google酒店搜索找到并预订这些房间,而酒店方面无需进行任何基础设施更新。这个案例完美展示了企业级Web Agent如何在不破坏现有系统的情况下创造新的商业价值。


在交通出行领域,一家领先的网约车公司使用TinyFish每月收集数百万个定价变量,实现近实时的动态市场调整。这种能力让他们能够快速响应竞争对手的价格策略,优化自己的定价模型,最终提升市场竞争力和盈利能力。想象一下,如果用人工方式来收集和分析这些数据,需要多少人力资源,而且很难保证数据的及时性和准确性。


电商领域的应用更是显示了Web Agent的强大能力。全球品牌可以同时跟踪数千个零售网站上的竞争对手定价、监控库存变化、捕捉促销数据。这种实时的市场情报让企业能够快速调整自己的定价策略,发现新的市场机会,避免错失重要的商业信息。更重要的是,这些数据的收集和分析完全自动化,大大降低了运营成本。


TinyFish的客户覆盖范围也在不断扩大。除了Google和DoorDash这样的科技巨头,ClassPass等成长型公司也在使用他们的服务。这表明企业级Web Agent的价值不仅限于大型企业,中等规模的公司同样能够从中受益。特别是在零售和旅游行业,TinyFish专注于动态价格监控这一核心应用场景,帮助企业实时追踪竞争对手的价格、促销、配送时间和库存水平。


DoorDash的数据科学总监Abhi Shah的评价特别有说服力:"TinyFish的平台大规模管理网络交互复杂性。除了DoorDash,TinyFish还为酒店、电商和市场平台的高风险工作流程提供动力,帮助企业捕获变化的网络数据,行动更快,并将持续变化转化为可衡量的结果。"这种来自实际用户的认可,比任何技术演示都更有说服力。


从商业模式角度来看,TinyFish的成功在于他们专注于解决企业的实际痛点,而不是追求技术的新颖性。传统上,这些任务由大型离岸团队进行手动数据录入,或者由定制软件脚本处理,但这些脚本在网站设计变更时经常失效。TinyFish提供了一个更加稳健和可扩展的解决方案,通过AI驱动的方法来应对网络环境的快速变化。


投资者为什么看好这个方向


ICONIQ Capital领投这轮融资的决定让我思考了很多。作为一家专注于成长期投资的顶级VC,ICONIQ的投资通常都有着深刻的战略考量。他们的合伙人Amit Agarwal在解释投资决策时提到了一个关键点:TinyFish已经在大规模客户中实现了产品化部署,这些客户本身就拥有足够的开发资源来自己构建类似系统。"他们已经将其运营化、产品化,为两个拥有所有内部开发资源来自己构建这类东西的大型客户大规模部署。"Agarwal说道。


这个观察非常重要。Google和DoorDash这样的技术公司,完全有能力自己开发网络自动化工具,但他们选择使用TinyFish的解决方案,这说明TinyFish提供的价值超越了简单的技术实现。我认为这种价值主要体现在三个方面:专业化程度、规模效应和持续创新能力。专业化程度体现在TinyFish对企业Web Agent领域的深度专注。他们不是试图做一个通用的AI平台,而是专门解决企业在网络自动化方面的特定问题。


ICONIQ的投资团队对TinyFish的技术能力给予了高度评价。Amit Agarwal表示:"TinyFish的创新企业Web Agent可以大规模复制人类在网络上的行为,具备企业所需的弹性和可靠性。这正在为企业和应用程序与网络交互、收集情报和自动化工作流程的方式奠定重大转变的基础。没有其他人解决了这个问题,TinyFish已经在今天的客户生产环境中交付了结果。"


规模效应则来自于他们的基础设施投资。建设能够支撑数十万个Web Agent同时运行的基础设施需要巨大的技术投入,这种投入对于大多数企业来说都是不经济的。TinyFish已经建成了这样的基础设施,并且具备了"行星级规模"的处理能力,这为他们创造了重要的竞争壁垒。



持续创新能力可能是最重要的因素。网络环境在不断变化,新的反爬虫技术、新的网站架构、新的安全措施层出不穷。TinyFish的团队专门应对这些挑战,他们的解决方案会随着网络环境的变化而不断进化。对于企业客户来说,这意味着他们可以专注于自己的核心业务,而不用担心网络自动化工具的维护和更新。


从市场时机来看,投资者们认为现在正是企业级Web Agent爆发的关键时刻。AI代理领域正在经历淘金热,大型科技公司和初创公司都在竞相利用从静态大语言模型向能够执行复杂多步骤任务的动态代理的转变。TinyFish在这个关键时刻已经建立了技术领先地位和客户基础,这为他们在快速增长的市场中占据有利位置创造了条件。


新融资为TinyFish提供了三到四年的发展资金,这让他们能够继续投资产品开发和扩大市场推广运营。CEO Sudheesh Nair明确表示,目标不仅仅是帮助企业节省成本,而是"帮助企业赚更多钱"。这种聚焦于创造增量价值而非仅仅优化成本的商业理念,正是投资者看好的重要原因。


AI Agent技术的关键突破与未来挑战


从技术角度来看,TinyFish的成功离不开近期大语言模型和推理能力的突破。过去的自动化工具依赖于硬编码的规则和脚本,无法适应网络环境的动态变化。而现在的AI模型具备了类似人类的推理能力,能够理解网页结构、适应界面变化、处理异常情况。但正如TinyFish所观察到的:"生成式AI和新发布的推理模型的进步使网络变得更加复杂,传统工具更难访问。"


我特别关注TinyFish如何解决AI agent在企业环境中面临的核心挑战。首先是准确性问题。消费级应用可以容忍偶尔的错误,但企业级应用对准确性的要求极高。一个定价错误或者数据遗漏可能导致重大的商业损失。TinyFish通过其专利基础设施来确保操作的精确性和一致性,这种基础设施能够学习和适应,同时保持企业级的可靠性标准。


规模化问题同样关键。个人用户可能一次只需要处理几个网站,但企业客户需要同时监控数千个平台。这不仅仅是数量的增加,更是质的变化。大规模部署需要考虑资源管理、错误处理、负载均衡等复杂问题。TinyFish的"行星级规模"能力显示了他们在这方面的技术积累。他们的系统使用先进的AI模型进行推理和探索,然后将这些知识编码化,以实现高速、确定性的大规模执行。


从技术架构的实现细节来看,Shuhao Zhang在开发过程中面临了许多有趣的技术决策。比如在AgentQL的开发中,他们选择使用DOM而非截图来分析页面,这是基于对AI模型训练数据和技术限制的深刻理解。他们还开发了复杂的预处理系统来处理现代网页的复杂结构,包括嵌套iframe、shadow DOM等技术细节。


安全性和合规性是另一个关键挑战。企业在网络上的行为必须符合各种法律法规,包括数据保护法、反垄断法等。TinyFish的Web Agent内置了企业级的安全态势和治理框架,确保所有操作都符合合规要求。特别是在处理用户身份和认证状态方面,Shuhao Zhang在访谈中特别强调了安全风险:"我绝对不建议用户与远程浏览器分享他们的会话。这是一个非常灰色的领域。"他建议企业应该为AI agent创建独立的身份和认证系统。


我还注意到TinyFish在处理网络复杂性方面的创新。现代网站使用各种技术来防止自动化访问,包括CAPTCHA、行为分析、IP限制等。TinyFish的Web Agent能够适应这些措施,保持稳定的访问能力。这种适应性不是一次性的,而是持续的学习和改进过程。他们甚至开发了"隐秘模式"来应对反爬虫检测,通过模拟真实浏览器的指纹特征来绕过这些限制。


但挑战依然存在。Shuhao Zhang坦承,对于无限滚动这样的复杂场景,他们还没有找到完美的解决方案:"按定义它是无限的。你总是需要切割它以适应上下文窗口,你需要记住你停在哪里然后重新开始。"这种技术诚实体现了他们对技术边界的清醒认识,也为未来的技术发展指明了方向。


对企业数字化转型的深远影响


我认为TinyFish代表的企业级Web Agent趋势,将对企业的数字化转型产生深远影响。正如他们在公司博客中所说:"如果你能将互联网转化为可分析的数据,这将从根本上为企业提供其他人没有的优势。"传统的企业信息系统主要依赖于结构化数据和API接口,但网络上的大量有价值信息仍然以非结构化的方式存在。企业级Web Agent提供了一种新的方式来获取和利用这些信息。


这种变化的意义不仅仅是技术层面的,更是战略层面的。企业的竞争优势越来越依赖于信息的获取速度和分析能力。能够更快、更准确地获取市场信息的企业,就能在竞争中占据优势。TinyFish的Web Agent让企业能够实时监控整个市场环境,这种能力在快速变化的商业环境中具有巨大价值。正如Sudheesh Nair所说,他们的目标是帮助企业"赚更多钱",而不仅仅是节省成本。



从成本角度来看,Web Agent也带来了显著的效益。传统的市场调研和竞争分析需要大量的人力投入,而且往往无法做到实时更新。企业级Web Agent可以24小时不间断地工作,成本远低于人工方式,而且准确性和一致性更高。这种效率提升让企业能够将更多资源投入到核心业务和创新活动中。


我特别看好Web Agent在供应链管理、风险控制、市场预测等领域的应用前景。供应链管理需要实时监控供应商的状况、价格变化、库存水平等信息。风险控制需要及时发现可能影响业务的外部因素。市场预测需要分析大量的市场数据和趋势信息。这些都是Web Agent能够发挥重要作用的领域。TinyFish目前专注于零售和旅游行业,但他们的技术完全可以扩展到其他行业。


更重要的是,Web Agent可能会改变企业获取外部信息的方式。传统模式下,企业主要依赖于购买第三方数据服务或者委托调研公司。但Web Agent让企业能够直接从源头获取最新、最准确的信息,减少了中间环节,提高了信息的时效性和可靠性。这种直接获取一手信息的能力,将成为企业竞争优势的重要来源。



TinyFish在其技术愿景中提到了一个重要观点:"技术在最佳状态下,不会要求你的注意力。它会淡入背景,为人类工作的重要性让路。"这种理念体现了他们对技术价值的深刻理解。最好的企业级技术应该是无形的,让用户能够专注于业务目标而不是技术细节。这正是企业级Web Agent的核心价值所在。


面临的挑战和未来发展


尽管我对企业级Web Agent的前景非常乐观,但这个领域仍然面临一些重要挑战。首先是技术挑战。网络环境在不断变化,新的反爬虫技术和安全措施不断出现。Web Agent需要持续进化来适应这些变化。TinyFish虽然已经在这方面取得了重要进展,但这是一个永无止境的技术竞赛。正如他们所说:"将网络的复杂性从障碍转化为机遇。"


法律和伦理问题是另一个重要挑战。虽然大部分网络信息是公开的,但自动化访问仍然可能涉及法律和伦理争议。不同国家和地区对网络爬虫的法律规定不同,企业需要确保自己的行为符合所有相关法律法规。TinyFish需要在技术能力和合规要求之间找到平衡。特别是在数据隐私和用户身份保护方面,需要建立行业标准和最佳实践。


竞争加剧也是一个现实挑战。随着企业级Web Agent市场的快速增长,越来越多的公司会进入这个领域。大型科技公司可能会开发自己的解决方案,专业软件公司也可能推出竞争产品。TinyFish需要持续创新来保持竞争优势。但从目前的情况来看,他们已经建立了重要的先发优势和技术壁垒。


从团队建设角度来看,TinyFish面临着典型的技术创业公司挑战。Shuhao Zhang在访谈中提到,"作为创始人最困难的部分绝对是定位和业务",这反映了技术型创始人在市场推广方面的普遍挑战。不过,他们的联合创始人Keith Zhai的媒体背景为团队在这方面提供了重要补强。



我认为TinyFish的成功策略应该集中在几个关键方面。首先是继续深化技术护城河,特别是在处理复杂网络环境和大规模部署方面的能力。他们需要保持在AI推理能力、网络适应性和企业级可靠性方面的技术领先地位。其次是扩大客户基础,从当前的大型企业扩展到中型企业市场。第三是建设生态系统,与其他企业软件供应商建立合作关系,让Web Agent成为更大数字化解决方案的一部分。


从产品发展路线来看,TinyFish正在从AgentQL这样的底层工具向完整的企业Web Agent解决方案演进。他们计划在未来一两个月内正式发布公司,届时可能会公布更多产品细节。从技术架构来看,他们正在构建整个技术栈,包括运行时环境的基础设施、应用层的业务逻辑处理,以及观察、监控和认证系统。


从行业发展角度来看,我预测企业级Web Agent将成为企业技术栈的标准组成部分。就像现在的企业都会使用CRM、ERP等系统一样,未来的企业也会普遍使用Web Agent来获取和分析外部信息。这个市场的规模可能会达到数百亿美元,为像TinyFish这样的早期参与者提供巨大的增长机会。


最终,我相信TinyFish代表的不仅仅是一种新的技术解决方案,更是企业与网络世界交互方式的根本性变革。在信息就是竞争优势的时代,能够更好地理解和利用网络信息的企业将获得持续的竞争优势。正如TinyFish所说:"专注于打动你的事情。对于其他一切,有TinyFish。"他们的4700万美元融资只是这个变革的开始,真正的价值创造还在后面。将网络的复杂性转化为商业机遇,这正是企业级Web Agent时代的核心命题。



文章来自于微信公众号“深思圈”,作者是“Leo”。


作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!