本文来自微信公众号“智能涌现”,作者:邓咏仪,36氪经授权发布。
文|邓咏仪
编辑|苏建勋
每一次点进直播间,你的选择已经在深刻改变着商业生态。
如今直播生态已经趋于成熟。直播间、社交媒体上的“达人”,事实上已经成了一个品牌的店面,人设代表着受众群体、风格和定位,达人负责捕捉新一季的时尚元素,快速出设计图、打样,国内工厂在半个月内就能完成生产和出货。
这套被称为“小单快返”的模式如此运转多年,催生出了类似SHEIN这样的跨境巨头,已经成为国内市场的标配。
但在广袤的海外市场,电商的基础设施参差不齐,物流、生产供给的缺乏、更多元化的用户群,藏着大量可以被AI改造的空间。
这是曾经负责淘宝直播业务的道放,离开阿里后,最想做到的事。
他出生于1983年,经历过移动互联网的所有风口——2008年毕业后,加入百度、360等公司,担任算法专家;2013年加入阿里后,一待就是11年。他曾经从0到1做出过亿用户的印度短视频平台VMate,负责过“点淘”APP,2021年开始统管淘宝直播业务。
“从达人的审美,到设计师的桌子,再到工厂再到消费者手中,这个过程太长了,信息严重扭曲。”道放说。
在电商还没有那么发达的其他市场,他希望能在其中建立起一套完整的AI电商服务体系,桥接国内供应链和海外达人生态。
货跟着流量在动,也直接重塑了供应链生态。比如,传统的服装供应链中,销售体系可能就会分为5到9级不等,商品流转周期很久,加价倍率也很高,品牌需要提前半年,就要把所有的商品设计出来、打样、下单,导致传统女装的爆款预测准确率较低,产生库存难题。
而在消费者端,因为大模型的发展,每个人获得一对一的服务,也变成了可能,这成为道放创业新项目Infimate的开始:为每个人做一对一专属的“赛博闺蜜”。
这个赛博闺蜜就像一个专属于你的AI购物Agent,—个能理解时尚趋势、提供个性化穿搭建议的朋友。“会基于你的身材、肤色,以及当下流行趋势,给用户做搭配,给到专业的建议。”道放向我们描述。
最重要的是,“赛博闺蜜”一定要能帮助你减少购物过程中的诸多繁杂琐事:计算最佳优惠、帮你抢券、告诉你各种小道省钱妙招,监测何时是最佳下单时机等等。
这也是Manus带来Agent浪潮之后,道放觉得创业时机成熟的原因:模型能够调用内部工具,完成各项任务。而这一切,必须要建立在有足够纵深的垂直领域数据和场景之上。
他以之前火爆的“Tiffany蓝”、“牛油果绿”等趋势举例。这些是由各个KOL、达人营造风向,传导到更广大的消费者中。
“这些KOL做到的事情,就是在时尚领域‘造词’,打造并传播当前热门的时尚元素。”道放认为,结合各类公域数据加以训练,以及用户主动告知的喜好,大模型已经足够有能力完成KOL所做的事:完成时尚元素的捕捉、预测以及表达,给用户做更精准的推荐。
同时,模型将这些标签建立好后,也可以把这套能力提供给B端,同时服务B端的品牌、达人等等,服务的场景多种多样,包括爆款预测、爆款生成、选品决策支持,最终构建起AI电商服务体系。
但这个不可避免会涉及一个问题:道放想做的事情,看似都在大厂射程范围内。为什么机会会在创业公司手中?
“首先,我们定位海外,海外电商平台无论是生态和玩家格局都更分散,平台垄断程度比较低。这是更有利于大模型切入的生态——给C端做个性化定制,用户天然就会更相信一个第三方的Agent。”道放表示。
更重要的是,道放曾在大厂内部从0到1创业,深知大厂在做决策时,需要考虑既往业务,也有资源侧重的考虑——对于探索Agent这类更新的业务方向,创业公司还是有着不少时间和空间。
事实上,在离开阿里后,道放曾在朋友圈宣布将在具身领域创业,目标是“为机器人尽快进入千家万户贡献自己的一点力量”。
但他和创业核心伙伴摸索一圈,最终评估下来,具身智能如今的技术探索还相当早期,起码要5-10年才有可能出现商业化上的飞跃,“离消费者还是有点远”。
为了离消费者、市场更近,道放还是选择暂缓具身方向的探索,把重点放到了AI+电商上。
在淘宝11年,掌管在风口上的直播电商业务,在道放身上也投下了浓重的影子——他语速极快,你甚至很难从他连续的思绪中,找到提问的切口。
道放也和普遍印象中的大厂高管不太一样。过往印象中,大厂高管可能手握天价预算,随对各种宏大战略信手拈来。但我们从道放的叙述中感受到一种朴素的目标——要找到贴近用户的场景,迅速建立起商业闭环,养活团队。
这是从阿里离开之后,道放的第一次公开表达。以下为我们和道放的对话,经编辑整理:
△Infimate创始人程道放 图源:企业授权
想过做家庭机器人,但也许太早了
《智能涌现》:你离开阿里后,发的第一条朋友圈就说自己要做具身机器人,现在要做AI电商,这个想法是怎么演变的?
道放:我是去年7月左右,阿里内部第一波GPT影响下来,就在研究AI对具身机器人和电商领域的影响。我一直呆到今年2月份,才最终决定出来创业。
其实我出来后还是在同步推进这两个方向,毕竟具身机器人和AI电商我们都深入研究了很多年,我自己也是学计算机的。
《智能涌现》:当时想从什么方向切入?
道放:从2023年7月开始,我还在阿里的时候,已经同时在关注具身和电商的AI应用了。出来创业后,我们把所有信息采集完,当时想过从家庭机器人开始切入。
当时,我们思考的是,具身当前的瓶颈在于真实场景的操作数据,所以从可行路径来看,应该去切垂类场景。在垂类上面,用现有的方法可以启动,能开始干活,进入场景之后就能获取更多的反馈和数据,才能迅速迭代。
我们的目标还是希望做具身机器人,但这个赛道现在处在一个技术发展的早期阶段,特别是第三步的精细操作,还需要很长时间的技术积累和突破。我们估算真正能做到家庭实用级别,至少还需要5-10年。
《智能涌现》:调研完之后,怎么看这个赛道的发展阶段?
道放:具身智能实际上涉及三个技术方向。
第一个技术方向,是AI的多模态交互,涉及到交互界面跟整个认知的理解,这个其实是偏软件,跟大模型同步发展的。它是豆包这类大模型APP的延伸,豆包多模态交互主要是文字和语音,但机器人除了语言之外,还需要控制表情、眼神、语气、微动作等,需要更多元的交互和控制。
第二个技术方向是基于强化学习的运动能力(Locomotion),主要解决双足行走以及全身控制。像唱歌跳舞、空翻,都是在这一部分基础上做出来的。
最重要的是第三个方向,端到端的模仿学习,去做手的操作。手的操作才会真正意义上替代人。
在现有技术进展上,前两部分进展还比较好,尤其是强化学习的运动能力。我们见到的所有空翻、马拉松跑步,全部都是这个技术的发展结果,但是这些展示的机器人很多都还需要遥控器控制的。
要做到自主操作,就需要第一步的多模态交互能力,包括表情微动作语音这部分,还有规划层。第二步强化学习这部分也还好。
《智能涌现》:现在前两步应该都做得不错了。
道放:现在所有人面临的难点是第三步的精细操作,因为它是接触式的精细动作,要到毫米级的精度,需要触觉和力的反馈信息,而且需要通用性才能进入家庭,所以很难。
我在阿里时调研完后得出结论,具身机器人的发展途径应该是切垂类,在垂类上用现有方法做启动,虽然准确度不够好,但通过不断给数据,处理各种Corner Case(罕见案例)后,会做得越来越好。
问题就是Corner Case(罕见案例)获取也是很难的,现在的高质量数据非常缺。我调研一圈下来,大家公认的还是做端到端模型是最优雅的方案,但这里需要的起码是十亿级别的数据,现在瓶颈还是很明显。
《智能涌现》:除了数据,还有其他难点吗?
道放:首先是精度和力控的问题。手部操作需要毫米级的精度,而且要有力的反馈。比如你拿一个鸡蛋,力度大了会捏碎,力度小了会掉,这需要非常精确的力控。现在的机器人手很难做到人手那种精细的触觉反馈和力度控制。
其次是通用性的挑战。不像工业机器人只需要做固定的几个动作,家庭机器人需要处理各种不同的物体、不同的环境、不同的任务。今天可能要叠衣服,明天要洗碗,后天要整理书架,每一个任务的动作空间和要求都完全不同。
第三是数据收集的问题。Imitation Learning(模仿学习)需要大量高质量的示范数据,但收集人类精细操作的数据非常困难和昂贵。不像图像识别可以从网上爬数据,手部操作的数据需要专门录制,而且要保证动作的准确性。
Corner Case(罕见案例)太多了。真实环境下的变化太多了,物体的材质、形状、重量、摆放位置都不一样,很难通过有限的训练数据覆盖所有情况。
所以虽然前两步技术相对成熟,但第三步的精细操作是真正决定机器人能否实用化的关键,也是最难攻克的。
《智能涌现》:这意味着落地场景很受限?
道放:现在存在明显的技术能力与市场需求之间会有一些错配,我们是想做“有用”比“有趣”多一点的场景的。
但用户真正需要的那些精细操作功能,比如帮你处理日常家务、分拣物品之类的任务,技术上还远远不成熟;现在的机器人用得更多的还是简单的迎宾互动、表演之类的,离真正打工还很远。
当然这不是说它没有价值,只是我们需要正视这个现实,同时也理解为什么消费级机器人市场推进得相对缓慢。技术发展需要时间,而市场也需要找到那个平衡点。
《智能涌现》:所以是因为技术曲线发展还相对早期,才选择考虑别的方向?
道放:在具身的第三阶段,就是真正能够自主规划操作的部分,大家公认的终局是要建立端到端的模型。但现在的真正问题在于,这个端到端的数据驱动,目前大家用的模仿学习方法,最大的问题就是通用性很差,要做出超出预期的体验感很难。
我们想做的,还是让机器人能走进千家万户,真正能干活。
我们预计这个方向需要等待一些通用性、“大单品”出现,我们团队擅长的部分才比较能发挥出更大的能量——做产品、做商业化。
要做“AI闺蜜”,而不是冷冰冰的推荐系统
《智能涌现》:如果具身智能赛道还太早,你后来看到了AI+电商的什么机会?
道放:更多是因为看到了AI技术带来的巨大变革机会,尤其是在电商领域。我们想做的事情,本质上是在AI时代探索新的电商入口的可能性,这需要全新的视角和组织形式。我相信AI在电商领域的应用,尤其是在个性化推荐、内容生成方面有很大潜力。创业会给我更大的自由度去探索这些可能性。
《智能涌现》:哪些关键技术转变,是比较核心的?
道放:今年年初的Manus其实是标志性事件。
这几年的AI应用,我会把他们分成三个阶段:
- 1.0时代主要是对话交互阶段,解决一些简单的信息需求,这个阶段持续了2-3年左右;
- 2.0时代的AI垂类应用,则更多关注提升效率,比如基于文生视频、图生视频、应用于各个垂直领域的场景中,这些应用大多面向企业端;
- 3.0时代是一个非常典型的发展阶段。最近一些新的模型,比如GPT-4,已经把工具的使用变成了模型训练的一部分。这就意味着3.0时代的技术,比如以Manus为代表的应用,已经不仅仅是信息交互,而是开始进入到操作的层面了。
这意味着什么?意味着AI不再只是给你信息,而是能像一个实习生一样,帮你操作电脑,执行一些机械但必要的工作,比如收集资料、应用滤镜等。这种computer use的能力是有巨大价值的。
《智能涌现》:怎么用一句话概括你们想做的事情?
道放:我们第一阶段要做的是电商领域的AI闺蜜,为用户提供专业购买建议和陪伴式购物体验。
《智能涌现》:你用的词是“闺蜜”,而非助手,为什么?
道放:我们更想做的Agent,是类似”赛博闺蜜”的概念,我们希望这个是类似闺蜜的亲密关系。
传统的AI助手更像是工具,你问它答,但闺蜜不一样。你跟闺蜜的关系是平等的,她也可以跟你聊一些兴趣话题,她也可以聊购买建议,就像你身边总有一个特别会买的朋友一样。
《智能涌现》:可以算是KOC(Key Opinion Consumer,关键意见消费者)吗?
道放:不是基于现有有名的KOL或者KOC的IP,而是基于这些人的专业能力。
我们希望做的是”闺蜜电商”这个场景。想象一下,如果你的闺蜜具有李佳琦的专业能力,同时能专门为你服务,你可以随时问她怎么买。她的专业性体现在所有的购买决策上,在趋势捕捉上比一般人更厉害,因为她有更全的数据。
但同时她又不是冷冰冰的,而是有温度的。
最重要的是,她不只是给建议,还有完整的执行能力。你可以直接跟她说想要什么,她就给你买了。
《智能涌现》:用户要怎么和这个AI闺蜜互动?
道放:有很多形式,单独App是一个形式,我们甚至希望用最极简的方式实现这个体验——他跟你加个社交媒体加好友,每天聊微信就好了,把所有的信息源和履约都帮你搞定。
你把商品链接发给他,他直接帮你买。他还有很多技巧性的领券能力,你自己都搞不到的优惠,他能在各种奇怪的群里薅出来。
虽然我们从时尚领域开始,但本质上可以扩展到整个生活领域。
《智能涌现》:怎么搞定履约?这个会涉及到很多终端、软件的交互。
道放:最近我和一个朋友讨论过一个场景,比如你想去星巴克点一杯咖啡,这有很多人会选择在闲鱼上抢券,便宜个几块钱,或者找代点。
这个过程是这样的,你先买券,买完券以后,你通过对话的方式找商家客服,然后你跟他讲说我在哪个店里面,我要买什么咖啡,把这个券给我用了。用完了以后,他会告诉你有一个码,有了这个码你就会去自提。
现在以Manus为代表的通用Agent,可以做到前面的部分,就是在小程序上帮你下单,但是涉及到更复杂的履约——在闲鱼上比较商家,甚至看看美团、抖音、私域社群之类的优惠券哪里更便宜,最后下单。
大模型调用工具完成更多工作,在我们看来就有很大价值了。这就是我们看中的一个机会。
《智能涌现》:履约其实会涉及智能体在执行任务,智能体也在技术发展很早期。想做到你们的目标,难在什么地方?
道放:这种过程一定需要更复杂的私有信息,包括把通用的知识与某个垂类应用的知识结合起来,形成一个垂类模型,才能解决很多问题。
《智能涌现》:怎么让这个智能体更有人味?我们过往的购物数据、互动数据可能很多都在平台。
道放:产品形态可以非常简单,就像一个数字闺蜜加了你的微信,每天聊天就好了,不需要很复杂的设计。
关键在于利用好平台上已有的数据资产,同时建立持续的互动机制。
本质上,AI是可以基于“懂你”的基础去收集和筛选信息的,它在趋势捕捉上比普通人更厉害,因为它能接触到更全面的数据。
但光有数据还不够,互动是核心。跟你的互动需要日常化,每天通过聊天才能真正了解你。
比如,和用户聊最近的流行趋势、明星节目如浪姐浪哥。这个AI闺蜜可以和你聊喜欢哪个选手,喜欢什么风格。
审美可以被”元素化”,这是AI的新机会
《智能涌现》:你经历了从货架电商到直播电商的时代演变,每个阶段,你觉得在供给和消费端都完成了什么事情?
道放:过去几年,直播电商的增长速度远超大盘。但现在其实国内的电商格局已经趋于稳定,大家对直播这个形态也会有些疲惫。
直播有很多好处,但它最大的问题就是时间成本太高。花那么长时间看直播的用户越来越少,你能看到抖音这些年也在回头大力搞货架电商。
这会是AI重新提供价值的机会。
《智能涌现》:怎么定义AI起到的作用?
道放:内容电商在电商2.0时代的核心价值,是KOL、主播和主理人们完成了一场“时尚平权”。
很多高奢品牌的高定和走秀,普通消费者在日常生活里是有点难get到(他们的厉害之处的)。但主播们把这些概念普及下来,在100到300块钱的夏装区间里,就能让你很快接触到这些元素。
最厉害的是,主播们不仅把这些元素融到商品上面,而且还把它说出来——牛油果绿、泡泡袖、小香风、西装版型——它实际上造了很多词,这些都是风格元素。
这是我们在2.0时代一直在探索的逻辑。
《智能涌现》:AI能够在2.0时代的基础上,在哪个环节发挥最大的作用?
道放:现在的问题应该是:AI有没有可能开启电商的3.0时代?
这一波大模型有个很重要的变量。在时尚领域,以前不可描述的东西——本质上是审美结果,现在可以被AI学习了。
因为数据现在够多了,模型可以去学习时尚趋势,把趋势元素化,基于元素化进行捕捉和预测。
原因很简单,主播已经把这些词表达出来了。小红书里有大量的人在讲这些东西,这些数据已经足够了。当你有足够数据的时候,AI学习这件事一点问题都没有。
难点在于预测之后,你需要把这个东西表达出来。
我和达人主播一直有交流,有一些头部主播讲的质量,就是跟普通主播不一样,能够清晰地讲出这个货的特点,而且非常迅速归纳风格和元素,一下就能让你懂。
AI的厉害之处就在这里——它可以在大趋势下把它元素化,学会所有优秀主播的表达能力。我们现在在不同风格下面,基本上都可以做得很好。而且要基于人群和场景做区分:年轻职场女性的OOTD、家居服饰,年轻人的party和年纪大女性的party,每种场景需求都不一样。
《智能涌现》:所以区别是在于可以一对一互动甚至服务。
道放:内容电商时代,就算强大如李佳琦,本质上也是广播式的一种覆盖。
他在618前做美妆小课堂,让女生们把自己情况——多少岁、什么肤质、是不是敏感肌、想买什么东西在评论区发出来,然后进行回复。
这其实是一种个性化定制过程。但是再怎么扩大,也只能覆盖很小一部分人。
加上大模型之后,AI本质上可以做到个性化定制全覆盖。它有这个能力,可以覆盖很多人。所以它变成了一个专业KOL的能力——趋势捕捉、预测,以及打动人的表达,以及可以跟你一对一服务。
这就像最有钱的人有专属造型师一样,现在年轻人也可以有这么有个性的穿搭师。
这也是更进一步的平权。以前是通过广播方式普及时尚信息,现在AI可以一对一告诉你,基于你的身材、肤色和最近流行趋势,给你搭配建议。
《智能涌现》:所以,这个AI闺蜜更多是工具属性的?
道放:这是第一阶段的能力。往后工具还可以拓展到社区,比如我们可能第二阶段会上AI试衣、穿搭社区之类的功能,用户可以在上面评价、互动,推一些很酷炫的玩法。
这就是AI闺蜜这个工具属性的产品,加上搜索场+推荐场,可以和购买场景连接在一起。
《智能涌现》:现在产品进展情况怎么样?
道放:我们已经基本完成产品验证,很快就会上线第一个版本。
AI+电商的最大价值是创造新入口
《智能涌现》:你们的目标用户、目标市场,是什么画像?
道放:第一部分会切年轻人群,因为年轻人对AI的整个接受度会更好一些,是AI Native用户,市场也是可能优先会选海外市场。
《智能涌现》:完全走To C路线吗?
道放:第一阶段会先从C端切入,但其实我们的能力是可以复用到B端,核心在于对趋势的把握和供应链的优化。
比如,在和用户的聊天的时候,包括用户的反馈,以及我们去抓取市面上流行的时尚元素。
模型能在一个流行趋势发酵周期的前期,就发现机会。一个服装的完整周期,典型的时间大概是45天。如果商家能提早十天就感知到,那就可以快速去生产。
《智能涌现》:所以在B端,更多是在生产流程的前端,帮他们找爆款?
道放:对于B端来说,我们能提升他们的选款能力,模型把选款能力可以提高了一个门槛。我们现在模型内测的效果,爆款率10%能上升到18%。正常平均60分,我其实能做到80分,这个就是很大的价值。
《智能涌现》:海外电商市场的发展阶段,和国内有多大差异?
道放:海外市场的内容电商还处于比较早期的爆发阶段。我们直观判断相当于国内2018年左右的阶段。
但海外市场的流行趋势信息更分散,这种分散的信息其实更有价值,AI可以更好地发挥打下信息差的作用。
货的差异也很大。比如美区,但他们内容电商的服饰品类只占20%,国内这个比例50%。为什么这么低?核心问题在于供应链。
以前,我们一直担心欧美人不适应电商直播,但问题可能既是用户习惯,也是供应链不足—货不够,自然养不成消费习惯。
直播电商必须依靠非标的时尚品类,但海外缺乏快返供应链。从中国海运就要一个月,清关再耽误时间,整个链路太慢了。目前美区只能卖李宁、耐克这种传统品牌,缺少快时尚支撑。
从用户习惯看,去年TikTok美区只有10%是直播售卖,70%是短视频售卖,20%是货架售卖。今年直播占比提升到了15%。
《智能涌现》:所以,海外实际市场需求和供应链之间的空隙,就是你们的机会。
道放:现在中国快时尚这套供应链很多能力是溢出的,供应过剩。市场需要有一套这一块的这个SaaS,帮助美国KOL桥接中国供应链。
《智能涌现》:SHEIN很早就把这个模式跑通了,他们如果愿意输出这套能力,只是差前端的KOL,如果SHEIN要做,怎么办?
道放:SHEIN是自营平台,本身就是品牌。当前KOL的核心需求还是做自有品牌。如果帮KOL做品牌,KOL可能会去TikTok卖,SHEIN就变成了供货商,做这件事情的动力可能是不足的。
而且要做这件事情,SHEIN需要改造整个设计链路,需要将现有的生产线和供应链与KOL的审美链接起来,服务成本很高。Tiktok这些电商平台也很难有精力自己下场深入到供应链来解决问题,所以还是迫切需要第三方的服务商来解决供给问题。
从价格区间来看,目前内容电商的价格区间会明显高于Shein目前的价格区间,因为KOL掌握有时尚元素的定义权和传播权。
《智能涌现》:在C端,你们要做AI闺蜜,在B端,还要做供应链服务的话,类似淘宝这样的大平台肯定会做,他们很难坐视一个新入口来颠覆他们。
道放:大厂的战略重点和平台属性,决定了他们很难在垂直细分领域做到极致。
比如AI试衣在很多电商App里的入口很深,从资源角度也需要花很多精力去争取。但这个功能是我们的核心业务。
另外从市场来看,目前海外电商的收敛远比国内小,所以基于海外市场还是存在大量的机会。
《智能涌现》:这次创业的目标,是什么?
道放:从我个人的发展经历其实可以看出我自己的选择偏好。虽然我过往基本都在大厂,但是基本上做得都是从0开始,或者高速增长的业务。业务相对比较独立,决策也相对闭环。所以我自己的能力和擅长的领域还是一些高速增长的独立业务。
我自己目前的阶段,其实已经过了财务追求的阶段。但是我坚信这一波AI的发展会深刻影响和改变整个人类社会的方方面面,甚至人类和自然的交互模式都有可能改变。所以我投身到这个领域,从自己熟悉的AI+电商切入,还是期待能亲身参与到这个进程中,如果能做出一些不错的产品,有我个人的签名,我感觉还是非常兴奋和值得投入的。
封面来源|企业授权
欢迎交流
扫码加入「智涌AI交流群」