AI热点 12小时前 106 阅读 0 评论

躺在风口上的硅谷教授,身家180亿不离讲台,捧出7家AI创企

作者头像
36氪

AI技术专栏作家 | 发布了 246 篇文章

这位拥有25亿美元(约合人民币179亿元)身家的大学教授,为何还坚守在一线课堂?

智东西9月2日报道,近日,AI数据平台Databricks在最新一轮融资后,估值突破1000亿美元(约合人民币7162亿元),有望成为全球估值第四高的AI独角兽,这也让外界关注到其联合创始人兼董事长、加州大学伯克利分校(后简称UCB)教授Ion Stoica,以及他横跨产业与学术界的传奇经历。

Stoica现年60岁,自2000年起开始在UCB任教,此后25年来均未离开这一校园。2010年至今,Stoica在UCB计算机学院参与了3所重要实验室的创办和管理。这些实验室在大数据、云计算和AI时代贡献了118个科研项目,其中不乏影响力广泛、几乎成为AI领域核心基础设施的项目,如大数据框架Spark、分布式执行框架Ray、大模型推理框架vLLM等。

Ion Stoica(图源:YouTube)

他还通过亲自参与创业、指导创业或是提供人脉与资金支持的方式,创办或孵化了至少7家知名创企,分布于数据基础设施、生成式AI等行业。

除了估值已经突破1000亿美元的Databricks,Stoica联合创办了估值10亿美元的AI托管计算平台Anyscale、估值6亿美元的LMArena(大模型竞技场)和估值3亿美元的视频流分析技术公司Conviva等企业。

Stoica是高性能AI与数据分析平台Alluxio创始人李浩源、数据中心操作系统创企Mesosphere创始人Benjamin Hindman的博士生导师,这两家创企均发源于开源项目,曾得到Stoica的指导。目前,Stoica还在大模型记忆技术创企Letta担任顾问。

尽管取得了商业上的成功,但Stoica仍然心系教育、科研。今年秋天,Stoica将继续留在课堂,教授操作系统和系统编程的本科课程。

通过在硅谷的人脉,Stoica给自己的实验室拉来了极为豪华的赞助商阵容,包括英伟达、Meta、蚂蚁集团、AMD、谷歌、亚马逊、华为等知名企业。他还给将自己创业获得的资产投入科研,给实验室提供资金支持。

在向《福布斯》分析自己成功的原因时,Stoica称,这要归功于他对科研的专注:“这是一种创造的过程,不断探索新想法。”在本文中,我们将回顾Stoica传奇的创业与科研经历,并了解他对自己成功经历的思考和总结。

01.

师从北大计算机校友张晖

06年首次开启创业

Stoica于2000年在卡耐基梅隆大学(后简称CMU)完成博士学业,导师是该校史上最年轻的终身教授张晖(北大计算机学院84级院友)。

同年,他加入UCB,并从教至今。UCB地处硅谷,有极为浓厚的创业氛围,Stoica也在2006年了自己的第一个创业项目——Conviva。

Conviva的创始团队(图源:Conviva官网)

2006年,流媒体内容逐渐兴起,YouTube已经成为主流平台之一。Stoica与他的导师张晖看到了市场对在线视频体验优化的需求,并在CMU和UCB的科研成果基础之上开始创业,联合创办了Conviva。

早期,Conviva专注于实时视频流分析,成为全球最早实现视频播放自适应的平台之一。该公司通过AI技术识别视频平台的播放质量问题,并收集用户的观看数据(包括正在观看的内容、用户喜好等),形成分析报告。

Conviva的主要客户包括美国福克斯公司(FOX)、NBC环球集团旗下的流媒体平台Peacock等。

Stoica原本在Conviva担任CTO一职,但目前已经不在Conviva拥有正式管理层职位。他仍然留在董事会,每周都会与团队见面。

成立以来,Conviva已经完成了7轮融资,总融资额为1.1亿美元。其上一轮融资于2017年完成,当时投后估值约为3亿美元。

02.

给大数据时代打造核心基础设施

成果转化为千亿估值创企

在创办Conviva的同时,Stoica也没有停下学术与科研的脚步。UCB计算机科学学部有每5年成立一个合作实验室的传统,Stoica深度参与了该学部近15年来成立的三大实验室,带领成员做出了颇具学术与行业影响力的成果。

2011年,UCB成立了AMP(算法、机器与人)实验室。在官宣实验室成立的演讲中,Stoica称,AMP实验室希望通过紧密集成算法、机器和人力,实现对大数据的理解。

在其存续的5年间,AMP实验室打造了25个科研项目,包括开源分布式资源管理框架Apache Mesos、开源分布式大数据处理框架Apache Spark、开源分布式数据编排平台Alluxio(原名Tachyon)等,成为大数据基础设施领域的重要贡献者。

这三大开源项目,最后都转化为创企:

Databricks(总融资208亿美元,估值超1000亿美元)

Databricks是Stoica参与创办的第二家创企,主营业务是AI数据分析平台。其创始团队由七位加州大学伯克利分校的教授和研究生组成,大都来自Stoica所管理的AMP实验室。

Databricks创始团队,Stoica为左数第二位(图源:Databricks)

2009年,Databricks的创始团队开发出开源分布式大数据处理框架Spark,并不断维护、更新这一项目,还一度创下了数据排序速度的世界纪录。

在将Spark作为开源项目运营一段时间后,Databricks的联合创始人、UCB副教授的Matei Zaharia称,Stoica希望将Spark变成一家初创公司,以鼓励用户更认真地对待此类来自高校实验室的研究。

2013年,Databricks正式成立。凭借着开源项目Spark的成功,Databricks在A轮融资时便获得来自a16z的1400万美元融资。2013年-2016年,Stoica担任Databricks CEO一职,深度参与公司日常管理与决策。

他在2016年将CEO一职交棒给了曾在AMP实验室担任访问学者的Ali Ghodsi。对于这一决定,他在接受《福布斯》采访时说道:“超过这个时间就意味着离开伯克利,所以我必须做出选择,我选择了回去。

如今,Databricks已经成长为估值超过1000亿美元的超级独角兽,服务超过60%的财富500强企业。Stoica仍在这一公司担任董事会执行主席的职务。

Stoica担任Databricks董事会执行主席(图源:Databricks)

Alluxio(总融资额7300万美元,估值暂未披露)

Alluxio原名Tachyon,是一个以内存为中心、容错的虚拟分布式存储系统,旨在解决Apache Spark生态系统内的数据共享挑战。

2015年,Alluxio正式成立,早期投资者为a16z——这是一家与Stoica关系密切的投资机构。其创始人兼CEO李浩源在AMPLab完成了相关研究,论文指导者便包括其博士生导师Stoica。

Alluxio目前的管理团队,上排左一为李浩源(图源:Alluxio官网)

随着技术趋势转向混合云和多云架构以及AI,Alluxio不断发展,为AI和数据密集型工作负载的数据访问提供解决方案。如今,Alluxio的AI加速平台为全球十大互联网公司中的九家提供支持。

Alluxio已经完成4轮融资,其最近一轮融资于2021年底完成,由高瓴创投领投,融资额达5000万美元。不过,其估值暂时未对外披露。

Mesosphere/D2iQ(总融资2.5亿美元,最高估值7.75亿美元)

Mesosphere成立于2013年,Stoica的学生Benjamin Hindman在其中担任CIPO(首席知识产权官)的职务。这家公司的主要技术来自于开源项目Apache Mesos,而Benjamin Hindman是这一项目的核心作者。

DCOS(数据中心操作系统)是Mesosphere的核心产品。Mesosphere将数据中心抽象为“单一大机器”,通过分布式内核调度和资源管理,为大规模计算与数据密集型工作负载提供统一的运行平台。

2015年,Mesosphere宣布获得a16z等顶级风投的投资。随着容器化、微服务和云原生趋势的兴起,Mesosphere后续在产品上逐渐转型,支持Kubernetes,并在2019年正式更名为D2iQ。D2iQ的解决方案主要面向混合云与企业级Kubernetes平台,帮助客户简化云原生应用的部署与运维。

迄今为止,D2iQ融资总额接近2.5亿美元,投资方包括a16z、Khosla创投、惠普等,其估值曾经在2018年完成的D轮融资后达到7.75亿美元。微软、谷歌等都曾传出有收购D2iQ的意向,但因D2iQ管理层反对而未能完成交易。

2023年底,D2iQ宣布终止运营,公司资产将进行清盘,并分配给债权人。

03.

指导高性能分布式执行框架Ray科研

衍生创企估值已达10亿美元

2017年初,Stoica参与到了UCB RISE(实时智能安全执行)实验室的创建与管理工作中。当时,Stoica等人已经意识到,数据生成、计算和执行之间的循环正在闭合,AI已成现实,计算的影响正在扩展到世界的每一个角落。

RISE实验室与AMP实验室一脉相承,期望能在大数据分析的基础上,进一步发展相关技术栈,帮助应用程序实时地、智能地且安全地与环境进行交互。

在大规模机器学习和强化学习领域,RISE实验室贡献了超41个开源项目,其中影响力最大的当属高性能分布式执行框架Ray,这一项目成功转化为创企Anyscale。

Anyscale(总融资2.59美元,估值10亿美元)

2019年,Anyscale成立,创始团队包括Stoica、Philipp Moritz(Stoica的博士生)和Robert Nishihara等人。Stoica目前在Anyscale担任董事会执行主席的职位。

Philipp Moritz和Robert Nishihara是Ray的主要作者,这一项目大幅度提升了分布式计算的易用性,让开发者能够用简单的API,把单机Python程序扩展到大规模分布式环境。Stoica指导这两位作者完成了Ray的相关研究。

Stocia与Anyscale其他联合创始人的合影(图源:Anyscale官网)

Ray提供了统一的编程方式,开发者不必关心底层分布式细节。相比于传统的Spark、Hadoop,Ray更灵活,支持低延迟的任务调度和多种计算模式(批处理、流式、在线推理等)。

这一项目在AI/ML领域影响力尤其大,业内许多流行的库都是基于Ray构建的,如Ray Tune超参数调优框架、Ray RLlib强化学习库等。

在此基础上,Anyscale为Ray提供了完全托管计算平台,添加了优化、可观察性、数据治理和开发人员工具等,使其成为运行Ray工作负载的最佳平台之一。

目前,Uber、OpenAI、Shopify和亚马逊等头部企业的开发人员正在使用Ray构建机器学习平台。Anyscale成立6年来共完成4轮融资,总融资额达2.59亿美元。2022年完成C轮融资后,其最新估值为10亿美元。

04.

实验室3年贡献52个项目

帮大模型造擂台、记忆库

2022年,Stoica又推动了天空计算实验室(Sky Computing Lab)的成立。天空计算是云平台之上的一层,其目标是实现云之间的相互协作,让应用程序能够在任何云提供商上实现“一次写入,随处运行”。

天空计算实验室近年来已经贡献了52个项目,打造了本轮生成式AI浪潮中重要的基础设施,包括大模型推理引擎vLLM、AI作业框架SkiPilot、大模型评估平台Chatbot Arena(现名LMArena)、视频生成模型评估平台Video Arena、智能体记忆系统MemGPT等,其中,LMArena和MemGPT已经实现公司化运作。

LMArena(总融资1亿美元,估值6亿美元)

LMArena由Stoica和他的学生Wei-Lin Chiang、Anastasasios N. Angelopoulos等人联合创办,Stoica担任LMArena的董事长。

这一平台通过“人类偏好投票”方式,公开评估大语言模型性能。当用户在这一平台上提交提示词后,会有两个匿名模型作答,然后基于用户选择判断哪个模型表现更佳。LMArena的数据与排行榜广受业界关注,甚至成为不少模型发布前的重要参考。

目前,LMArena托管了400多个AI模型,平台用户投票数达到350多万张。今年年初,LMArena完成1亿美元的种子轮融资,领投机构为a16z,投后估值达6亿美元。

融资完成后,LMArena团队发布了全新设计的平台,优化了界面和投票流程,并逐步加入登录、聊天记录保存、WebDev Arena等功能模块。

Letta(总融资1000万美元,估值7000万美元)

Letta成立于2024年,由天空计算实验室的两位博士生Sarah Wooders和Charles Packer创办。其中,Stoica是Sarah Wooders的博士生导师,并在该公司担任顾问。

Letta创始团队(图源:Letta)

Letta的核心技术源自MemGPT,后者是天空计算实验室的一个开源项目。MemGPT提出了“大模型操作系统”的概念,专注于大模型的上下文管理和长期记忆能力,让大模型变得“有状态”(Stateful)。

2023年10月,MemGPT项目在正式发布论文和代码之前,就凭借一份白皮书迅速走红。该项目正式发布在GitHub上后,已经收获1.8万星标收藏,有近2000个分支项目。

Letta目前的主要产品包括Letta云(打造和部署有状态Agent的云平台)和用于增强Agent处理外部文件能力的Letta文件系统。

2024年9月,Letta获得1000万美元种子轮融资,估值达7000万美元。

05.

靠拉赞助和创业反哺科研

80多名学生从中受益

Stoica过去15年内主持工作的三所实验室,拥有不少共同的特点:开源、前沿、与产业密切结合。这些特点让它们不止停留在学术机构的层面,还拥有孵化器般的能力。

自2011年的AMP实验室以来,Stoica就特别注重与产业界的密切合作。AMP实验室拉来了谷歌、SAP、亚马逊、华为、IBM、英特尔、微软、VMWare等企业作为赞助商。

此后,Stoica的实验室还获得了英伟达、Meta、蚂蚁集团、AMD、博通、三星、Lambda等企业的支持。

同时,通过不断创业,Stoica的创业项目还使他成为了亿万富翁,现资产大约有25亿美元,他将一部分个人资产投入实验室的运营工作中。

这些真金白银的支持让Stoica的实验室拥有资金和资源,得以同时开展大量研究项目。

目前,Stoica在UCB担任研究资金削减问题工作组的主席。他鼓励其他教授向他一样通过创业获取资金,在美国政府削减科研资助的大背景下继续科研。

但成为亿万富翁并非Stoica的目标。Stoica在接受《福布斯》采访时称:“我仍然是一名学者,如果赚钱是唯一的驱动力,那我就去IPO了。这是最简单的方法,但我不是出于这一目的而创业,我想创造有意义的东西。

他还认为,自己在创业中获得的成功,得益于对科研的专注:“这是一种创造的过程,不断探索新想法。”此外,大学的科研项目大多具有开源性质,能吸引企业使用,而大部分公司不会开源最佳系统。基于开源项目打造的企业,在起步阶段就能获得不少声量。

将Stoica留在学术界的原因,可能是他的学生们。他向《福布斯》说道:“这些处在成长期的年轻人不知道什么做的成,什么做不成,但他们有信念,能做出让人出乎意料的解决方案。

由Stoica亲自指导的80多名学生从他的资源和关系网中受益,他们绝大多数都在学术界、大公司就职,或是拥有自己的初创公司,其中包括在Databricks工作的至少7名学生。

06.

结语:高校前沿探索仍有望转化为巨大商业价值

当今的AI浪潮中,有越来越多颇具影响力的成果,诞生在产业界,这也让外界一度怀疑:在计算资源要求越来越高、规模效应越来越强烈的AI领域,学术界的价值何在?

而Stoica教授的成功经历证明,在高校进行的开源、前沿探索项目,往往能对产业界起到极为重要的补充和启发性作用。在以适当的方式转化为企业后,仍然可以贡献巨大的产业和商业价值。

本文来自微信公众号“智东西”(ID:zhidxcom),作者:陈骏达,编辑:云鹏,36氪经授权发布。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!