AI热点 4月前 177 阅读 0 评论

AI 的终点不是对话框,这家公司想让真实世界成为 AI 的提示词

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章


全球首款多模态 AI 硬件 Looki L1 发布,抢先实现了 OpenAI 想象中的交互未来。


过去两年,很多人对 AI 的印象,基本都停留在一个对话框里:


有问题,敲几个字,它就给答案。好用是好用,但也让人觉得有点单调——AI 难道就只能困在对话框里吗?


我一直觉得,真正的 AI,不该只是「会背百科全书的老师」,而应该能跟我一起走进生活,理解我当下正在经历什么


昨晚刚刚正式发布的 Looki L1,可能就是第一台真正让 AI「走出来」的设备。



这就是 Looki L1,有三个颜色可供选择|图片来源:Looki


早在半个月前,我开始试用 Looki L1,第一次拿到手,我差点以为这是个挂坠形相机。但很快我发现,它既不是运动相机,也不是简单挂在脖子上的 GPT 硬件。



我日常习惯于把 Looki L1 磁吸在胸前。Looki 为用户提供了不同的机身贴纸,我挑了个鬼脸图案|图片来源:极客公园


当我开启它的 Story Mode(故事模式),它会自动捕捉视频和声音,然后交给 AI 去理解我当下的情境,那一刻,我身边的一切——街道、朋友的笑声、我的表情——都成了 AI 的提示词。


和它一起生活的感觉很特别:我经历什么,它就经历什么,它不再只是一个回答问题的工具,而是一个和我共享日常的 AI 伙伴。


过去几年,大部分 AI 产品都在强调「效率」和「生产力」。但能真正进入每个人生活的 AI,几乎还是一片空白。


Looki 正是瞄准了这项空白。成立一年,这个团队在半年时间里完成了三轮融资(天使、天使+、Pre-A),金额超千万美金。本轮融资由 EBVC 领投,老股东 BAI、阿尔法公社和同歌创投超额追投。根据官方定义,它是一款 AI lifelogging camera(AI 生活日志相机),是全球首个真正实现了多模态交互的 AI 硬件。


使用的这段时间,我已经忘了说过多少句「我靠」了。回过头看,它不仅是一个「生活记忆体」,还让我重新理解了自己,更带给我不少生活习惯的变化。而在它身上,也打开了我对「AI 交互」未来的想象。


01

当 AI 进入我的生活


和传统的任何相机相比,Looki 的外观设计、操作实在太简单了,甚至可以说是「简陋」。


Looki L1 没有屏幕,一共只有两个物理按键,通过长短按开启 Story Mode(间隔拍摄)、拍照、录像和录音功能。机身正面的 touchpad 实现了和 AI 对话的功能,体验和微信的发送语音很像。



侧边是两个功能键,正面是 touchpad,可以触按|图片来源:极客公园


而且它的重量只有 30 克,戴在身上没什么感觉,以至于让我觉得,这个团队的目的就是让用户少去操作它,尽量忘掉这个相机的存在。



Looki 的 App 界面|图片来源:极客公园


Looki 的 App 也延续了极简思路,如上图所示:


  • For You:每天 AI 主动推送的「生活流」,像私人版 Instagram feed,但只给你看;


  • Chat:拥有生活全记忆的 AI 聊天,绝对是最懂我的 AI,可以在这里聊自己的生活;


  • Lifelog:AI 自动理解和整理的生活档案,把素材变成有主题的 Moments;


  • Device:主要用来查看设备状态,以及一些其他基本设置。


用 Looki 记录日常,最大的感受是「投入当下」。


我最常用的功能是 Story mode,也就是间隔自动拍摄。开启之后,我便不再管它,无需考虑什么时候按快门,专心享受当下就行。


如果遇到突然想记录的画面,也不需要从兜里掏出手机,再解锁、拍照。而是直接按一下 looki L1 的拍照键或录制键。


不知道你是否有这样的感受:实际上,无论用什么设备,拍摄不是最难的事情。最难的是拍摄后的素材整理。而这,也是我认为真正让 Looki 差异化于其他相机的关键。


以往,我们可能拍摄了海量的照片和视频,但绝大多数都沉睡在硬盘里,无从整理。


而 Looki 的「Moments」功能,利用多模态 AI 的能力,理解视频中的人物、场景和情感,能将海量素材自动整理成一个个有主题的事件,并从里面提炼出「高光片段」,将碎片化的瞬间编织成有意义的叙事。整个过程都不需要人介入,节省了大量时间。



在「moments」页面,可以查看高光时刻,和所有素材片段|图片来源:极客公园


一天下来,当我们翻看「Moments」界面时,就好像有了自己的「传记」。


另外,这些天观察下来,Looki 生成的 vlog 也比较有讲究。它会自己捋顺一条故事线,然后分析出一个主题,并根据这个主题配乐,同时给不同的画面配文或者关键词。整体有一种欧美纪录片的质感。



我截取了两个 Looki 生成的 vlog 的封面,可以感受下风格|图片来源:极客公园


我曾经试过拍 vlog,但坚持半个月就放弃了,一方面总会忘记拿出手机或相机来拍摄,一方面每天录了很多素材之后,晚上剪辑、制作也会花掉很长时间,耗费精力。因此,对于我这种懒人来说,它就是我目前能遇到的最佳解决方案了。


02

产品设计哲学:

AI 向内,让我看见更多的自己


这个产品对我最大的改变,是让我开始更多地向内看。


这项功劳可能归结于 Looki 的内容生成能力。我每天都会期待它推送给我 Moment 和 vlog,因为我很好奇 AI 如何解读我,如何解读我的生活。



Looki 给我推送的 moment,看它配文的解读是种乐趣|图片来源:极客公园


自从有了第一次惊喜体验后,我不仅日常把它磁吸在胸前,当我坐下来的时候,我也会把它取下来放在桌子上,将镜头对着我自己。这样,我开始出现在了视频画面里。而且,Looki AI 基于场景和音频、视频等信息,也迅速地判断出我是这个故事的主人公,并彻底记住我。



Looki L1 可以依靠背后的磁吸按钮,立在桌子上|图片来源:极客公园


它经常会拾取一些被我忽视的、但可能当时情绪更丰沛的生活片段,然后配上解读和描述,看了之后,我常常会感到,「哦,原来我是这样度过那个时刻的。」、「原来我那个时刻那么开心。」——要知道,如果不是看到 Looki L1 的「回放」,我一定会把那个时刻忽视掉了,只当作它是一个庸常、乏味的日常碎片。


当我回看的那一刻,我仿佛看到了更多的自己,重新获得了一段时光。


即便如此,Looki L1 也并不能替代传统相机。


传统相机的逻辑是追求画质、追求高光时刻。比如,大疆的无人机,GoPro 的极限运动相机,都是围绕「极致画面」展开。但 Looki 的选择恰好相反:它不追求 4K,而是采用 Sony IMX681 CMOS(和 Meta Rayban 同款),分辨率 1080p,但换来的是 12 小时续航和 30 克的轻便。


社交媒体让人们习惯于展示「高光时刻」,而恰恰相反,Looki 不是为了小红书、Instagram 这样的「表演式分享」设计的。它要捕捉的,是生活的连续性和日常细节。


毕竟,我们的生活不是由一个个「完美瞬间」组成的,那些不那么光鲜,却琐碎、真实的「非高光」日常,才是「我之所以为我」的关键。


如今,我们正处在一个被内容淹没的环境里,很容易被各种宏大叙事或八卦消息所牵引。因此,从 Looki 的产品机制看,它具备一种「反潮流」的气质,它似乎在引导人关注自己的生活,从自己的日常里、从自己身上发掘惊喜。


03

Looki 让我看到了「多模态 AI 硬件」的潜力


其实,「记录一生」这个想法很早就有人提过。


上世纪 90 年代,计算机先驱戈登·贝尔就尝试过全天佩戴相机来记录生活,最后失败了。原因很简单:拍得再多,没有 AI 的辅助,大量素材也很难被整理为真正有用的故事。


而 Looki 的突破在于:多模态 AI。它能理解视觉、声音和语义,让碎片化的素材变成可用的「记忆」。


例如,当我问 Looki,我昨天喝了什么咖啡时,它能够迅速分析录像素材,告诉我分别在哪家店铺,喝了什么口味的咖啡,还会描述一下当时的氛围等等,同时把当时的照片罗列出来。



我和 Looki AI 聊天的页面|图片来源:极客公园


有多位创业者曾对我表达过相似的观点,大模型如果想要真正发挥作用,一定要具备对物理世界的感知能力,要具备硬件。这可能也是为什么「随身 AI 硬件」会成为当下创投圈备受关注的热点。


Looki 的创新之处就在于,它率先通过巧妙设计的硬件释放了多模态 AI 的能力,让人们感知到了「多模态 AI」到底能够在现实生活中做到什么,将未来摆在了所有人眼前。


过去,服务于个人生活的 AI 很难做,一个关键原因就是缺少上下文(context)。


Looki 团队告诉我,他们接入的大模型是 ChatGPT 和 Gemini。但是我体验下来,Looki AI 完全优于我使用的网页版的 ChatGPT 和 Gemini,它会更加懂我,更能够结合我的生活来和我聊天。


我想,核心原因,就在于 Looki 的硬件捕捉了我所处的物理环境信息,为 AI 提供了更多上下文。如果没有个性化的上下文,那么 AI 给出的答案往往是正确但无用的。


可以说,Looki 能生成什么内容,基本取决于它拍摄到什么。我带着它去的地方越多,它生成的内容也就越丰富、越深刻。此时,照片、视频不再是终点,而是提示词(Prompt)。有了 Looki L1,整个世界都在成为我的 AI 提示词。


Looki L1 的外形看上去像个外星人,每次戴着它出门,都好像带着一位外星朋友,一同走进这个社会。它会记录我们一起去过的地方,见过的人,经历过的事件。它就像一个和我有着共同经历、总出现在我身边的朋友。它也会随着经历的丰富而成长,会和我形成感官共鸣。


还记得,前段时间 OpenAI 收购了前苹果设计总监 Jony Ive 的公司,目标要改变人和 AI 之间的交互方式,打算在 2026 年推出 AI 硬件,而其概念流出图和 Looki L1 极为相似。


也许,我们今天看到的 Looki L1,就是「个人 AI 硬件」的起点。


文章来自于微信公众号“极客公园”,作者是“苏子华”。


作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!