AI热点 5小时前 63 阅读 0 评论

AI正在改写地图APP!这一次轮到谷歌了

作者头像
AI中国

AI技术专栏作家 | 发布了 246 篇文章

谷歌这回整了个大活儿!


即日起,所有开发者可通过Gemini API调用谷歌地图工具,以便轻松将位置感知功能整合进其应用中。


简单粗暴地说,现在但凡你的应用跟“位置”沾边,Gemini都能立刻调用谷歌地图那套庞大的地理数据库——2.5亿个地点全给它接通了。


这意味着,无论是餐馆推荐、路线规划,还是房产选址、旅行行程规划,AI都能基于实时地图数据直接回答。



根据谷歌文档,目前支持这项功能的模型包括:Gemini 2.5 Flash-Lite、Gemini 2.5 Pro、Gemini 2.5 Flash和 Gemini 2.0 Flash(但不包括2.0 Flash Lite)


而且是基于查询次数来收取API费用——当前费率为每1000条有事实依据的提示25美元,所谓有事实依据是指至少有一个结果来自谷歌地图。


这里需要注意,如果一次向谷歌地图发送了多个查询,则这些查询仅计为一次请求。



Okk,话不多说,直接来看这项功能都有哪些玩法——


Gemini+谷歌地图,出行规划如此简单


首先来看“谷歌宣传委员”Logan Kilpatrick的打样(实际身份为谷歌AI Studio负责人),这里他使用了一个支持调用谷歌地图工具的智能体。


通过动动嘴,他语音请求AI帮忙推荐芝加哥地区还不错的意大利餐厅。


而AI立刻结合谷歌地图,直接找到了排名前三的餐厅:



不过此时他又想起了一家心心念念已久的餐厅,于是再次请求AI帮忙寻找。由于使用的是语音指令,所以这时Logan Kilpatrick需要告诉AI餐厅名字如何拼写。


而经过一番沟通(让AI尝试三种不同的拼写方式来自行寻找),结果AI还真成功完成了任务:



总之,经过多番体验,Logan Kilpatrick直言:


这真的很酷。我认为要点在于,这种体验非常个性化、可视化


除此之外,更多网友的玩法也展示了该功能的另一大特色——实时性


比如在确定要去某家餐厅后,用户还能直接问当日具体营业时间以及路况。


依托谷歌地图庞大的实时数据,用户总是能及时掌握最新情况:



目前,所有人都能去谷歌AI Studio体验这项新功能。而且打开设置面板,我们还能根据自己的需要切换不同的模型和语音,甚至右侧还能看到系统提示词。



系统提示词的内容大概为:


你是一个友好且乐于助人的对话式智能体,用于演示“Google Maps定位”功能。你的主要目标是通过与用户合作规划一个简单的下午行程(城市 -> 餐厅 -> 活动)来展示这项技术。你的语气应该是热情、信息丰富且简洁。


所有这些都是可自定义的,并且用户能通过左侧聊天框来为这个智能体继续添加功能。



Anyway,今后只要开发者的应用存在下列需求(覆盖餐饮外卖、旅游房地产等),都可以通过调用谷歌地图来回答:


  • 完整且准确地回答特定地理位置的问题;
  • 构建对话式旅行规划工具和本地指南;
  • 根据位置和用户偏好(例如餐厅或商店)推荐地图注点;
  • 为社交、零售或外卖服务打造基于地理位置的体验。


而对于这项新功能,网友们的评价be like:


人工智能刚刚获得了位置感。



将AI植入实时世界模型,赋予其感知器官,这是迈向真正自主的第一步。



瞄准空间智能,AI正在改写地图APP


有一说一,其实对于“AI+地图APP”这一套,我们国内的观众姥爷并不陌生。


毕竟AI浪潮之下,如高德这样的国内玩家早在谷歌之前就已有相关尝试,而且瞄准的还是空间智能落地这一核心战略高地。


何谓空间智能?这主要是指AI围绕时间和空间进行预测和推理的能力,一般而言它是可以应用于世界模型、落地在XR设备、改写自动驾驶和具身智能机器人的基础技术。


这一技术最直接、最现成的应用就是导航地图APP,毕竟它无时无刻都在进行时间、空间预测和推理。


基于此,国民级应用高德地图也早早出手,成了国内率先落地空间智能的第一批玩家。


今年7月,他们一举推出小高老师智能体,让AI根据用户所处时空,实时应对各种复杂的出行/生活服务需求。


比如随便一个想法:作为一个i人,喜欢独处,而且冬天怕冷。


传统应对这样一个需求,可能需要跨APP来处理。首先就得在小某书上大找特找一通,然后筛选比较,中途还得逐个搜地图APP,看看位置距离,最后得到的结果还不一定会喜欢。


但现在,只要对高德地图说出这句话,几秒之内它就能给出一个详细方案,还是可以直接调动APP内所有服务和工具的那种。



而且继小高老师智能体之后,他们在9月又声势浩大地推出了高德扫街榜


基于高德地图20年来积攒的海量用户数据,高德扫街榜沉淀出多个榜单,包括状元榜、扫街榜、热门打卡和城市指南,从很多方面满足了咱们日常出行的不同需求。


截至目前,其统计范围覆盖用户反复前往的119万家回头店,生成排名的数据来自近一年5370万人的13亿次导航,对应里程长度232亿公里,相当于绕地球58万圈。



而探究这些落地之所以能成功的背后原因,其实可以看到一个清晰的脉络——AI正在让地图从“导航工具”变成“空间智能体”


过去的地图APP,大多是你输入起点、终点,它帮你规划路线,仅此而已。


但今天,有了AI之后,地图更像是“活”起来了。它不再只是告诉你“怎么走”,而是能理解“你是谁、要去哪、为什么去”,甚至在你还没想清楚之前,就能预测你的需求。


比如以小高老师为代表的智能体,它本质上就是在地图上叠加了一个世界模型——知道空间中发生了什么、你处于哪种语境、下一步可能需要什么。


在此基础上,若再叠加上大量数据,我们对地图能做什么无疑将拥有更大想象力。就像高德扫街榜一样,地图将不再只用来导航,而是还能成为城市体验的智能入口。


从这个角度看,无论是谷歌用Gemini赋能地图,还是高德用AI重塑出行体验,背后其实都在做同一件事:


让AI真正走出屏幕,进入现实世界的坐标系。


换句话说,AI正在完成对地图的升维改造——它正从一个静态的、平面的“工具”,演进为一个动态的、立体的“智能空间”



BTW,回到谷歌这次推出的API服务,如今所有开发者也能在自己的应用中用上这一最新AI能力了。


你打算用来干点啥?欢迎评论区分享一波~


开发者文档:

https://ai.google.dev/gemini-api/docs/maps-grounding?hl=zh-cn#pricing_and_rate_limits


参考链接:

[1]https://x.com/googleaistudio/status/1979290587951173803?s=46&t=fzKJptGJMpr-yj3MUXd6HA

[2]https://x.com/aigclink/status/1979403636158664748?s=46&t=fzKJptGJMpr-yj3MUXd6HA


文章来自于“量子位”,作者“一水”。

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!