AI人物 21小时前 183 阅读 0 评论

“世人只知张小龙,无人记我陶建辉”

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

57 岁程序员陶建辉的人生憾事与梦想。

作者 | 唐小引

出品 | CSDN(ID:CSDNnews)

2010 年 10 月 20 日,来自加拿大滑铁卢大学的一群学生研发出一款名为 Kik 的跨平台聊天应用,基于手机通讯录免费短信聊天,火速风靡。

在广州离群索居的张小龙于自己默默耕耘的 QQ 邮箱的阅读空间里,第一次知道了 Kik 这个新产品。一个深夜,张小龙给马化腾写邮件,建议由他的广州团队做一款类似 Kik 的产品,马化腾当即回复同意。

而小米这边,洪锋拦住了赶着去开会的雷军,给他演示 Kik 的使用。雷军决定小米要立即跟进,并抢在了腾讯之前发布了米聊。然而后来的结果大家都了然,米聊败了,如过江之鲫的 IM(即时通讯)应用消失在互联网的历史洪流里,世人都用起了微信,记住了“微信之父”张小龙。

这是雷军的遗憾,因为他既错过了张小龙(雷军曾有机会收购张小龙及其 FoxMail),又败给了张小龙。

亦是现年 57 岁始终热衷于写代码的涛思数据创始人&CEO 陶建辉的遗憾:“我第一个创业公司,那是个更大的梦想,我是要颠覆短信、彩信的人,我认为 QQ、MSN 都将被我颠覆。结果却被张小龙拿走了,这是我人生最大的遗憾。”

2007 年,通讯起家、还在美国摩托罗拉手机部门做软件工程师的陶建辉看着收发短信还得付费,一直在思考,如何在不费手机电量、不消耗多少流量的情况下,将消息免费实时推送到手机上?圣诞节时,趁着妻子带儿子外出旅游,他自己在家埋头写代码,花了不到 10 天的时间写出了完整的 Demo(说来也巧,现代操作系统的起源 Unix 也是 Ken Thompson 趁着老婆休假带孩子回娘家开发出来的)。

看了演示的妻子觉得挺靠谱,于是 2008 年刚开年,陶建辉立马从摩托罗拉辞职,回到北京创业做起了和信。2009 年,和信正式对外发布,提供客户端、插件。“我是全世界第一个意识到要做通讯录匹配的。”IM 是从 PC 到移动互联网时代变更的标志性应用,其典型特征便是通讯录匹配(熟人社交),还有就是不要在线状态,这一方式也让从 QQ 起家的微信终于甩掉了“既有 QQ 为何还要微信”的质疑。

2009 年过春节,陶建辉和老友 CSDN 创始人蒋涛的拜年短信都是通过“和信”发送。它和 iPhone 的 iMessage 一样,甚至还有更多功能,在网页上看得见通讯录、通话记录,发短信可以在网页上发,但发出去显示的还是用户自己的手机号。“Apple 的 iMessage 是真正百分之百跟我一致的。对方装了 App,就完全走互联网;对方没装(App),就走正常短信。蒋涛特别喜欢这个功能。因为我们都要群发拜年短信,结果他就遇到一个麻烦,初一给我打电话:‘老陶,我的手机被禁掉了!’因为群发短信发得太多了。”

陶建辉用的方法很简单,从网页到服务端,服务端 Push 到手机(把手机变成一个“短信猫”),将短信发出去,走的并非运营商的短信网关,而是网络。一个中文汉字两个字节,1KB 是 1024 个字节,等于五百多个汉字,价格就相当便宜了。

除此之外,和信的“个性手机报”功能有点类似于今天的微信公众号,支持 Twitter(现 X)、Facebook(现 Meta)。还有一个功能叫“抓客”,可以从网页上抓取任何选中的文字、图片或音乐,直接传送到自己或朋友的手机上。当时,像大众点评(2003 年创立)里的地址,都是在网上搜索,搜索后约人吃饭发短信。而陶建辉和他们谈合作,使用“抓客”一点就直接到手机上,大众点评的团队非常兴奋,觉得这个工具太好了。

陶建辉心怀让短信、彩信免费的梦想,所有方案都做好了,但做得很艰难。iPhone、Android 手机都在美国刚发布不久,国内还是功能机主流、智能手机萌芽的时代,和信主要还是基于诺基亚的塞班系统。最终弹尽粮绝,因为欠缴房租以至于办公室都被人封了。身无分文,又不小心摔断了腓骨,陶建辉进入了人生至暗时刻,中科大的老师和同学雪中送炭硬给他塞了两万块钱,最终,2010 年和信以卖给联发科收场。

多年之后回想起来,陶建辉依然倍感遗憾,“我极具创新的 idea,结果最后这领域赢家是张小龙,我没赚到钱。当时一直认为我应该干一场大的,不服气,觉得自己有如此多的创意,而且这么勤奋,居然没有成功。”免费消息,这个他在 2007 年想到的 idea,2008 年创业开始做的产品,比 Kik、微信都早了两三年,全世界记住了张小龙,却几乎没人知道他曾率先有此创想。

“我们迎来了公司历史上最好的发展机会,能跑多快就跑多快”

2025 年春节 DeepSeek 爆火出圈让陶建辉再次看到了“干一场大的”的机会,此时陶建辉的第三次创业——涛思数据 TDengine 已经进入了第八个年头,他异常兴奋,用原话形容就是“热血沸腾”,经常在深更半夜给并肩奋战多年的联合创始人发信息分享自己最新的 idea。从年初至今,他每次开会都会讲这样一句话:“我们迎来了公司历史上最好的发展机会,能跑多快就跑多快”。

陶建辉直言 DeepSeek 带来的机会、空间比做时序数据库实在大太多,“我在公司内部都讲了,这是从 100 亿人民币变成 1000 亿人民币的概念。我们公司以前努力,也就是 100 亿到 200 亿的规模,但现在可以到 1000 亿到 2000 亿的规模。这是个多激动人心的事情!而且各种条件都准备好了,如果眼睁睁地看着这个机会溜走,那才真是人生憾事。”

是什么样的机会让陶建辉能“比 2017 年做 TDengine 的时候更兴奋”?

2016 年 AlphaGo 打败李世石让 AI 大火,陶建辉想到以自动驾驶为代表的行业产生的海量数据,必须要用一定的方式来处理,像自动驾驶的数据几乎都是时序数据,这是 TDengine 诞生的原因之一。

而 2022 年 ChatGPT 带来了更猛的 AI 浪潮,影响范围更大,让陶建辉意识到每个人、每个行业都要充分利用 AI。在数据分析领域,ChatBI 开始兴起,TDengine 也在其产品中顺势推出了时序数据 AI 智能体 TDgpt,实现一行 SQL 即可调用 AI 能力。

但这远远不够,ChatBI 去掉了对程序员的要求,对业务人员依然有很强的依赖,提示工程成了所有人、行业应用 AI 的一大难题。而 TDgpt 主要用来做时序数据预测、异常检测,躲在 TDengine 的背后,不是被最终用户直接使用的。“ChatBI 并没有让我真正发生质变,它还是对业务人员有依赖,业务人员要会问问题,直到春节 DeepSeek 爆火,我觉得必须要赶上 AI 大潮,天天在琢磨。”

“提出问题比解决问题更重要,但绝大多数人是提不出问题的”,到底该怎么办?

某天陶建辉突然想到是不是可以把“问”这个环节取代掉,不用 Chat,而是把数据分析主动推给用户,像我们平常刷抖音一样?

对于工业场景等传统行业,早就形成了教科书式的管理流程和标准方法,AI 全部都知道,因为它已经存在几十年,无数人做过研究,除了极少情况下会有某个企业自创一套新的管理体系或新指标。他立即用 DeepSeek 进行案例验证,比如一个来自煤矿行业的人和他讲煤矿安全时,提到了“来压”。对煤矿完全不懂的陶建辉问 DeepSeek “来压”是什么、可以用来做什么?如果要用来压建个面板,应该是什么样的?结果,DeepSeek 就把来龙去脉讲得清清楚楚(包括压力监测、为了煤矿安全应该建什么面板、物理量单位叫什么等等),这让陶建辉的认知得到刷新,对由 AI 直接告诉用户的做法深信不疑。

原本,多年以来,工业场景有着很强的知识壁垒,但其数据又是海量低价值密度的,需要一种极其高效的方法将数据价值挖掘分析出来。但现在,年轻人越来越不愿意进入这个行业,“数据采集很早就存在,中国制造业的自动化水平已经相当高,广泛应用 SCADA(数据采集与监控系统)、DCS (分布式控制系统)和 PLC(可编程控制器),却没有办法做数据分析。在中国,仅制造企业就有六十多万家,在这之中,虽然有像宁德时代、三一重工这样的巨无霸,他们有自己的 IT 团队和 BI 软件,但绝大部分,可能 90% 以上,连数据分析师都没有。”

而 TDengine 耕耘八年,其产品已经深入钢铁、石油、石化、智能制造等诸多行业,都是以被集成的方式,最终用户并不知道其背后的存在。作为程序员、时序数据库的深耕者,陶建辉对 IT 互联网等新兴行业了如指掌,但对钢铁、石油这些传统行业一无所知,陶建辉几度拿水务、烟草等各种行业碰到的实际情况自嘲:“像离 TDengine 公司很近的北控水务,与他们交流,水务的那些词我根本搞不懂,怎么给他们开发软件?一开口,人家就说你这个菜单都不是我想要的名称”。

现在,情况发生了变化:行业知识壁垒被消除,AI 什么行业都懂;所有的 AI 应用都变成了一个 Chat 的聊天界面,让做应用变得更简单了,在这样的情况下,底层的基础软件公司能够往应用层做,直达最终用户。“AI 让我们这些做基础软件的公司能够往上做,做应用的壁垒在于行业知识,这个壁垒正好被大模型解决了,所以我认为这个空间大太多”。

而 TDengine 原有的“超级表”“虚拟表”的创新提供了极大的助力:他们解决了 Text-to-SQL 的问题,“我们现在做 Text-to-SQL 没什么挑战,是因为我们的表结构非常简单,而表结构简单的原因则在于超级表以及虚拟表,它可以把很多表合到一起,让一个设备就一张表,大量减少关联查询,让 AI 去适应它,就马上变简单了,否则太难做了”。

东风已至,万事俱备。“我很想抢第一,特别紧张,一心想赶快推出来。而且我觉得这个空间确实很大,你看见了机会,抓不到就错过了。我觉得这个机会正好是我可以抓得住的。抓得到的是什么呢?第一,我们账上钱还挺多的,有团队、有人、有钱。第二,也不是所有有钱有人就能做,因为项目开发有机遇。我们正好已经做了时序数据库,而且我大概在去年 9、10 月份,就已经在做数据目录、数据标准化、数据情景化的设计开发了。”

紧张又兴奋的陶建辉开启了每天 14 个小时、一周七天的节奏,而团队三十多人也以一周六天的节奏全力冲刺。

AI 原生的工业数据管理平台 IDMP(Industrial Data Management Platform)就此诞生,主打功能便是“无问智推”,不需要提问,让数据自己说话,基于采集的数据,自动感知应用场景,自动生成场景特有的指标、可视化面板、报表和实时数据分析。

注:感兴趣的朋友可以点击“阅读原文”免费下载体验 TDengine IDMP 无问智推。听陶总说,为了降低体验门槛,TDengine 还特别推出了相应的免费云服务。

从 Pull(拉)到 Push(推)

“没有人比我更懂数据目录、数据标准化、数据情景化”

怎么个“无问智推”法?

陶建辉在自己的文章里这样写道:“如果说 ChatBI 的‘智能问数’是‘有问才答’,那么 IDMP 这种从拉到推的模式,不妨称之为‘无问智推’。”借助 LLM 与 AI Agent 技术,数据能够实现“主动开口”—— 业务分析的核心洞察会直接推送给用户,让分析模式从 “拉取(Pull)” 彻底转向 “推送(Push)”。这意味着用户的数据消费变成了被动接收,数据分析由此迈入“抖音时代”,门槛被直接降至零。

这背后起到决定性因素的,是陶建辉所倡导的“数据平台必须变成 AI-Ready 的平台”,以存储和计算为核心的数据库被改造成为 AI-Ready 的数据平台,而成为 AI-Ready 的数据平台有三个标准:数据目录、数据标准化、数据情景化。经过许久的深思熟虑,他亲自手绘了一张 AI 驱动的工业数据管理平台架构图。

要让 AI 完全把错综复杂的关系理清楚是很难的。工业企业的数据本身具有清晰的层级结构,比如“工厂-车间-产线-设备-测点”。但在实际的数据系统中,这些层级往往被打碎,设备的采集点、报警指标、KPI 等信息分散在不同表结构中,缺乏统一管理。TDengine IDMP 以“树状结构”作为核心模型,对物理与逻辑实体进行统一建模与组织。每个节点不仅包含结构关系,还可以挂载属性、分析逻辑、事件规则,支持从组织结构、设备类型等多个视角灵活构建数据目录,实现同一数据在不同维度下的统一呈现与多角度分析。这意味着:用户不再是去找一张表、一列数据,而是在管理一个具有上下文的“对象”。

  • 数据标准化:支持物理单位的转化,“全中国只有我们的产品做到了”

就标准化来说,国内没有任何一家软件支持物理单位的转化。“比如数据库里存的是‘米/秒’,另外一张表存的是‘公里/小时’,要算两列车的平均速度,得先把单位转化,否则怎么算?还有,在写任何一个表达式,比如功率等于电流乘以电压,把它写成功率等于电流加电压,我们马上就会报错,提示电流和电压是两个完全不同类型的物理量。全中国只有我们产品做到了。”

这反映了工业系统接入的原始数据的不统一,来自不同协议、不同采集系统,命名不一、单位不同、精度不一。TDengine IDMP 引入“元素模板”和“属性规范”机制,通过统一的字段定义、单位体系、换算规则、上下限设定等规则,让每一个数据点具备明确的含义。借助这一标准化体系,系统可以自动完成字段匹配与单位转换,为 AI 提供明确的语义基础,助力实现更可靠的数据分析与智能推理。

光有结构和标准还不够。工业数据往往只有“数值”,却缺乏“背景”。一个指标是否异常,不仅取决于它的数值本身,还要看它处于什么状态、关联哪些事件、上下游是否也发生了变化。

TDengine IDMP 支持在目录和属性层级上挂载丰富的语义信息,如描述、标签、设备型号、安装位置、运行状态、是否可参与计算等,让每一个数据点都有明确的业务含义与上下文关系。系统借此构建“数据情景图谱”,使数据从“裸值”转变为具备业务语境的实体,为 AI 提供更完整的语义基础,提升异常识别与智能判断的准确性。

这并非陶建辉的独创,他坦言“数据目录、数据标准化、数据情景化这三个关键点,几乎没有什么创新,是完全模仿 PI System 做的”。但是,他很肯定没有人比他更懂,“我已经琢磨了 PI System 三年都不止,我比他们内部人还懂。我为了研究它,掏了 2 万美金买了一个试用版。我对这个系统做了很多的研究,没有这些准备,不太可能做出一个产品来。”

经常往返于中美的陶建辉能够很明显地感受到差异,“数据目录、数据标准化、数据情景化,我在中国见到的所有工业界的人,几乎没人随口而出。而在欧美,所有人都跟我谈这个”。

但陶建辉在将自己开发 IDMP 的心路历程写成文章发布之后,收获了不少的知音与反馈。采访时陶建辉不时很高兴地和我分享,有谁评论说从“拉”到“推”很有意义、CCF 杜小勇老师点评“陶总做了一件很大的事情”,对于评论里有多个留言提到了“数据目录、数据标准化和数据情景化”,陶建辉深觉对方真正看懂了 IDMP。我在朋友圈里转发了陶建辉的文章后,我的同事 CSDN 算法负责人兴冲冲地找到我说“陶总是做实事的人,他提的数据目录、数据标准是我们正在做的,我们的定义叫‘内容字典’”。

而他最担心的,是西门子、施耐德、GE、Aveva 等工业软件巨头会跟进。“因为他们一切都具备,早就做好了数据目录、情景化、标准化,要做一个 AI 应用易如反掌。而我们公司之前只是一个数据库。因此我特别感谢他们,怕被他们抢先,我真的是被‘网’住了,每天工作好多个小时。”

在 IDMP 的产品研发上,还有一个颇有意思的技术细节。去掉 Chat,采用 AI 推荐,那怎么能够确保 AI 推荐的效果?陶建辉表示,问得越详细,效果越好、幻觉越小,这取决于提示词。IDMP 的做法是将提示词直接写在系统程序里。“我们有两个人只写提示词,天天琢磨提示词。提示词写得好坏差别很大,跟写程序一样。分解任务是我们做程序、做软件设计必须做的,分解到每个任务要给它一个输入,这个输入还得讲得清楚。”

深思:由“无问智推”看 AI 如何重构数据库和数据 Infra

IDMP 产品发布之后,收获了很多的下载量与注册用户数。陶建辉的目光在于国计民生的战场,希望让中小企业拥有自己的“数据分析师”,业务人员需要实时的洞察,不用依赖于 IT 工程师或数据分析师,可以直接操作。“现在,通过 IDMP,中小企业可以和工具巨头企业站在同一起跑线上竞争了。我本来想把我这个产品的域名都注册了,叫 7x24.ai,但没有注册到。它实际上就是让任何企业、人人都有了一个数据分析师,这个市场太大了。”

但他同时提到,数据分析师和 IT 工程师也无需焦虑,“这个行业不会消失,数据分析师保证还需要,不可能全部解决问题。世界上金字塔的底座,绝对是不懂的用户、小白用户占大多数。人类的需求总是不会被满足的。当你以前受工具限制,只能看 10 张报表,现在由于 IDMP,你可能有 100 张报表,能够更好地把数据价值挖掘出来。因此工作还是有,并不会没有。就像大家都认为 AI 把程序员代替了,我个人认为是根本代替不了,相反,会让程序员群体变得更大。”

陶建辉认为,AI 将重构数据库和数据 Infra。重构主要表现在两方面。一方面是以往是“拉”的模式,要写个 SQL 语句去获取数据,现在变成“推”。第二个就是数据结构要发生改变,不能仅仅是个二维表格,而是带有丰富的上下文和业务语义的数据。数据库一定会转成这样。“当数据库的接口和数据消费的方式发生改变时,那些不拥抱 AI 的数据库就会被淘汰出去,这就是洗牌的机会。”就像云计算出现,好多软件都要在云上重新开发。就包括数据库也要做所谓的云原生数据库,它跟传统的数据库确实有区别。因此在 AI 时代,数据基础设施确实要具备这两点,否则很难为 AI 服务,这就是数据库厂商新的机会。

而“无问智推”的下一步,是要把根因分析做好。“洞察要形成更好的决策,就需要知道根因。我们物联网工业场景,监测异常数据才有意义,因此异常发生后,一定要知道是什么问题导致的。这个时候我们要利用 AI 技术,通过各种方式提供一个分析报告,告诉用户是什么导致了这个不正常。现在都还是靠人工做,而且严重依赖行业经验。这是我们下一个战场。”陶建辉如是说道,根因分析是真正能够把 AI 技术转化成生产力的环节,“预计将于元旦前正式发布”。

结语:一个典型的程序员,从未停歇的极客之心

如前所言,即使身为 CEO,陶建辉依然在亲自参与产品研发,关心程序员群体的未来,相信 AI 不会替代程序员而是赋能更多人成为开发者,期待编程的普惠化让更多年轻人加入创造。AI 卷程序员先卷前端,但陶建辉说 IDMP 的前端是 4 个人才做完。“AI 对真正职业程序员的提效并不是太高,因为要 Debug AI 生成的程序,但 AI 能够将写模板这些活儿干了,对于小白、初级用户是绝对的提效。”

生活质朴,一心扑在产品和社区上,工作之外唯二的爱好可能就是跑步,以及作为「爱倒腾的程序员」写写自己及师长家人的故事了。常年穿着标志性的橙色 POLO 衫,一年生活花费不足两万,“赚到的钱最终会捐出,不会留给子女”。

从和信、快乐妈咪到涛思数据,三次创业亲自设计公司 Logo,域名也都是自己注册的,他关注每个细节,不断追求极致体验。采访的最后,陶建辉和我说道:

全世界都知道张小龙,不记得我陶建辉。我就希望“无问智推”能够让大家记得的是我陶建辉。你就把这句话写下来:“无问智推”一定会流行起来,各种形式的“无问智推”一定会流行起来。我不想这次又被另外一个“张小龙”拿走,这是我内心的真实想法。我希望我是能够收获这个红利、收获商业成功的,不能像我第一次创业一样,被张小龙、腾讯收割了。

一如他在八年前创立 TDengine 时写下的话:钱再多,也难让人在历史上留下痕迹,但一幅好的作品却可以传承,让后人好好地品味。

鬓微霜又何妨?初心不变,始终愿“Leave a dent in the world”!这就是写代码 40 年、57 岁程序员陶建辉的人生梦想。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!