AI热点 6小时前 79 阅读 0 评论

武大、蚂蚁集团发布新一代遥感大模型:12边型战士

作者头像
快科技

AI技术专栏作家 | 发布了 246 篇文章

快科技8月9日消息,近日,武汉大学与蚂蚁集团联合发布了新一代语义增强遥感大模型SkySense,堪称12边型战士。

其相关研究成果在国际知名学术期刊《自然机器智能》上在线发表。

当前,遥感基础大模型在复杂动态地球观测场景应用中面临挑战,如多模态遥感影像数据融合性能欠佳、下游任务微调依赖大量数据、对遥感语义信息挖掘不足等。

为攻克这些难题,研究团队基于前期多模态遥感大模型SkySense,研发出SkySense。

SkySense基于来自11个卫星载荷的2700万组多模态遥感影像,采用两阶段渐进式学习完成预训练。有效缓解了大模型对复杂微调流程和大量标注数据的依赖,极大提升了实用性与泛化性。

研究团队在农业、林业、灾害管理等7个领域的12种典型地球观测任务中,对SkySense进行全面评估。

实验结果显示,SkySense 在这12项任务中均表现卓越,性能优于其他模型。与同期最先进方法相比,在全量微调分类与检测任务上,平均精度提升4.79%;在少样本提示分割任务上,平均交并比提升14.08%。

SkySense的前序版本SkySense,曾在国际计算机视觉领域顶会CVPR发表,并在2024年世界人工智能大会发布。

而此次SkySense在农业生产评估、灾害应急响应、国土资源监测等任务中,性能更为优异、稳定,还新增免微调部署能力。

(举报)

作者头像

AI前线

专注人工智能前沿技术报道,深入解析AI发展趋势与应用场景

246篇文章 1.2M阅读 56.3k粉丝

评论 (128)

用户头像

AI爱好者

2小时前

这个更新太令人期待了!视频分析功能将极大扩展AI的应用场景,特别是在教育和内容创作领域。

用户头像

开发者小明

昨天

有没有人测试过新的API响应速度?我们正在开发一个实时视频分析应用,非常关注性能表现。

作者头像

AI前线 作者

12小时前

我们测试的平均响应时间在300ms左右,比上一代快了很多,适合实时应用场景。

用户头像

科技观察家

3天前

GPT-4的视频处理能力已经接近专业级水平,这可能会对内容审核、视频编辑等行业产生颠覆性影响。期待看到更多创新应用!