AI学习站
首页 AI热点 AI教程
用户头像

标准会员

会员时间

积分 0

历史 通知(0)
首页
AI动态
技术前沿
工具与教程
大模型
AI投资分析
AI落地
AI政策法规

登录账号

忘记密码?

还没有账号? 立即注册

我已阅读并同意用户协议和隐私政策

已有账号? 立即登录

AI视频 6天前

Kimi Linear – 月之暗面开源的新型混合线性注意力架构

Kimi Linear是什么Kimi Linear 是月之暗面推出的新型混合线性注意力架构,专为提升大型语言模型(LLMs)在长序列任务中的效率和性能设计。核心组件 Kimi Delta Attention(KDA)通过精细化的通道级门控机制和高效的块处理算法,显著提升模型的表达能力和硬件效率。Kimi Linear 采用 3:1 的 KDA 与全注意力层(MLA)混合设计,大幅减少 KV 缓

AI中国 AI中国
170 0
AI视频 6天前

Music 2.0 – MiniMax推出的新一代音乐创作模型

Music 2.0是什么Music 2.0 是MiniMax最新推出的先进音乐创作模型。模型能精准捕捉和还原人声的细腻情绪与器乐的动态张力,支持多种唱法和风格切换,如流行、爵士、摇滚等,还能实现男女对唱、阿卡贝拉等效果。模型生成的旋律抓耳且具有完整结构,能独立控制伴奏乐器,打造丰富编曲。音质升级,带来沉浸式体验,生成影视级配乐独白。Music 2.0让音乐创作让每个人都能轻松表达音乐灵感,实现

AI中国 AI中国
206 0
AI视频 6天前

Aardvark – OpenAI推出的漏洞发现与修复智能体

Aardvark是什么Aardvark 是 OpenAI 推出的基于 GPT-5 的智能体,能自动发现和修复代码中的安全漏洞。Aardvark通过不间断地分析源代码仓库,识别漏洞、评估可利用性、划分严重等级,提出针对性修复方案。Aardvark 用多阶段工作流程,包括分析、提交扫描、验证和修复,能像人类安全研究员一样阅读代码、编写测试、验证漏洞。Aardvark能无缝集成 GitHub 和现有

AI中国 AI中国
166 0
AI视频 6天前

WOWService – 美团推出的大模型交互系统技术报告

WOWService是什么WOWService 是美团 LongCat 团队发布的智能交互系统,通过融合大型语言模型(LLMs)和多智能体架构,优化用户体验并降低成本。系统针对智能交互领域的五大挑战:冷启动数据构建、多轮对话性能、业务规则变化、单一 LLM 的局限性以及多轮对话的量化评估难题,提出了创新解决方案。WOWService 采用四阶段训练流水线:持续预训练(CPT)、有监督微调(SF

AI中国 AI中国
192 0
魔笔 AI Chat Builder:让 AI 对话秒变可交互界面
图文教程 1周前

魔笔 AI Chat Builder:让 AI 对话秒变可交互界面

一、背景1.1 AI 对话应用崛起近年来,AI 应用赛道全面“爆发”。在应用开发领域,模型微调、强化学习、智能体(Agent)开发框架等技术快速成熟;与此同时,AI 应用的交互形态也在不断演进,更加多元和复杂。目前,常见的 AI 应用交互形态主要包括:对话类:如在线客服机器人、企业 Copilot;生成类:如文案撰写、代码生成、图像设计生成工具;分析与决策类:如 BI 报表分析、数据洞察工具;

AI中国 AI中国
140 0
AI浏览器的正确使用姿势是什么?我从Dia的这90+个Skills里找到了一些好场景
图文教程 1周前

AI浏览器的正确使用姿势是什么?我从Dia的这90+个Skills里找到了一些好场景

 最近 AI 行业扎堆做 AI 浏览器,虽然我不太看好这个“入口”的长期价值,但是在把 AI 扔个浏览器自动获取上下文,这个 AI 的使用方法还是非常提效的。人呐,不怕自己不知道某个工具。怕的是,明明知道这个工具,但是不如别人用得好。AI 浏览器在帮助人类高效处理信息这件事上,价值是无限的。但,正确的姿势是什么?全球知名 AI 浏览器 Dia 有一个 Skills 板块,整合了用户贡献的技能提

AI中国 AI中国
163 0
ubuntu 本地部署MinerU完成文档解析
图文教程 1周前

ubuntu 本地部署MinerU完成文档解析

1.系统环境配置(1)检查CUDA环境和GPU状态需要CUDA11.8或以上nvcc --version如无,用下述代码sudo apt install nvidia-cuda-toolkit检查GPU状态和显存(显示的CUDA版本为最高版本)nvidia-smi(2)创建虚拟环境避免依赖冲突先检查自己安装的版本python --versionconda create -n mineru py

AI中国 AI中国
197 0
AI将所有生意都卷成了创意产业
图文教程 1周前

AI将所有生意都卷成了创意产业

01创意产业,官方通常称为“文化创意产业”,传媒、影视、娱乐、游戏、工艺、设计、时尚、出版、文旅等等,仿佛创意是文化产业的专属。传统创意产业的生意,一般会加“studio”的后缀,意指“兼具创作与生产功能的复合空间”,如film studio(电影制片厂)、photo studio(摄影工作室)、tv studio(电视演播室)、visual studio(可视化工作室)……不知从何时开始,s

AI中国 AI中国
143 0
初创公司的增长之道:如何让AI主动推荐你的产品?(下)
图文教程 1周前

初创公司的增长之道:如何让AI主动推荐你的产品?(下)

上一篇文章我们总结了AEO专家的心得,这里我们更具体地举例说明,有哪些工具可以帮助我们做AEO,以及如何把关键词拓展为完整的问题。我们思考的重点应该是:1.消费者生活中会搜什么关键词,会如何问问题? 2.消费者会去哪些平台搜寻?(可能去B站找开箱视频,去小红书上找评价,所以品牌不能只经营单一渠道内容) 3.要写AI偏好的内容,比如用第一手经验和可靠案例,而且内容要直接回答用户提出的问题。可以更

AI中国 AI中国
103 0
AI绘画 1周前

Lupa AI Upscaler

🧠 Lupa AI Upscaler 是什么?Lupa AI Upscaler 是一款基于人工智能的在线图像高清放大与增强工具,能够将模糊、像素化或低分辨率的图片瞬间转换为高清4K质量。该平台利用深度学习技术智能修复图像细节、增强纹理、减少噪点,让旧照片或普通图片焕发新生。Lupa AI 强调“一键4K高清转换”,无需技术背景即可实现高质量放大。它广泛应用于电商、摄影、社交媒体内容优化、印刷

AI中国 AI中国
192 0
AI视频 1周前

AI阴影去除器

🌤️ AI阴影去除器 是什么?AI阴影去除器Remove Shadow From Photo 是一款专业级的 AI照片去阴影工具,通过先进的机器学习算法,自动识别并去除人像、产品或风景照片中的阴影,让图像恢复自然光照和平衡的视觉效果。它能在数秒内完成阴影去除,输出高达4K分辨率的干净照片,无需专业技能或复杂操作。这款工具由AI影像技术驱动,深度学习了数百万张照片的光影特征,因此在“识别阴影

AI中国 AI中国
76 0
AI音频 1周前

音秘AudioMyst

🎧 音秘(AudioMyst)是什么?音秘 AudioMyst 是百度推出的一款 AI播客创作与语音合成工具,以“让创作更聪明,让声音更动人”为核心理念,旨在帮助个人创作者与企业用户轻松制作播客内容。它结合了 UGC(用户原创内容)与 PGC(专业生产内容)模式,通过AI生成脚本、智能配音与音色克隆,全面降低播客制作门槛,打造一个人人可用的全场景音频内容生态平台。无论是自媒体主播、企业品牌

AI中国 AI中国
128 0
AI视频 1周前

酷宣AI

🚀 一、酷宣AI是什么?酷宣AI 是一个集 AI图文排版、AI生图、AI修图、AI视频生成、AI动图制作 于一体的超级智能体内容创作平台。它融合了多种先进的AI生成模型,覆盖从 文字 → 图片 → 视频 → 动图 的全链路内容创作场景,帮助用户在几分钟内完成专业级视觉内容。无论你是自媒体创作者、品牌营销人员、教师、还是设计小白,酷宣AI都能帮助你:快速生成高颜值图文内容一键制作海报、

AI中国 AI中国
104 0
AI视频 1周前

Hailuo 2.3 – MiniMax推出的AI视频生成模型

Hailuo 2.3是什么Hailuo 2.3 是MiniMax推出的先进 AI 视频生成模型,基于 Hailuo 02 升级而来。模型在肢体动作、微表情、风格化表现及物理真实性方面实现显著提升,能生成更加流畅自然且复杂的动态画面,支持多种画风,如动漫、水墨等。模型对运动指令的响应更加精准,画面效果接近实拍。Hailuo 2.3 包含Hailuo 2.3 提供高质量的视频生成效果,适合对细节和

AI中国 AI中国
85 0
AI视频 1周前

Glyph – 智谱联合清华开源的视觉文本压缩框架

Glyph是什么Glyph 是智谱联合清华大学 CoAI 实验室开源的创新框架,能通过视觉 – 文本压缩解决大语言模型(LLM)上下文过长的问题。框架将长文本渲染为图像,用视觉语言模型(VLM)处理图像,实现 3 – 4 倍的上下文压缩。Glyph 显著降低了计算成本和显存占用,同时大幅提升推理速度。Glyph在多模态任务中表现出色,展现出强大的泛化能力。Glyph的主要功能长上下文压

AI中国 AI中国
178 0
AI视频 1周前

GigaBrain-0 – 开源VLA具身模型,基于世界模型生成的数据

GigaBrain-0是什么GigaBrain-0 是新型的视觉-语言-行动(VLA)基础模型,由世界模型生成的数据驱动。模型通过大规模生成多样化数据,减少了对真实机器人数据的依赖,显著提升了跨任务泛化能力。采用 RGB-D 输入建模,增强了空间感知能力,通过具身思维链(Embodied CoT)监督,强化了模型在任务执行中的推理能力。使得 GigaBrain-0 在真实世界中的灵巧操作、长时

AI中国 AI中国
115 0
AI视频 1周前

SoulX-Podcast – Soul推出的多说话人语音合成模型

SoulX-Podcast是什么SoulX-Podcast 是 Soul AI Lab 推出的多说话人文本到语音(TTS)模型,专为生成长篇播客对话设计。模型参数为1.7B,支持普通话、英语及多种汉语方言(如四川话、河南话、粤语等),具备跨方言提示功能,可通过普通话提示生成目标方言语音。模型支持副语言控制(如笑声、叹气等),增强语音合成的真实感。SoulX-Podcast 能生成超过 90 分

AI中国 AI中国
70 0
AI视频 1周前

FlowithOS – Flowith推出的全球首个智能体操作系统

FlowithOS是什么FlowithOS是Flowith推出的全球首个智能体操作系统,使其能像人类一样与数字世界互动。FlowithOS具备浏览器、终端和脚本使用功能,能自动执行复杂任务,如文件管理、游戏操作等。通过在线强化学习和自我进化能力,FlowithOS的智能体能随时间变得更加智能和个性化。在性能评测中,Flowith OS 表现卓越,其“代码 + 视觉”双模态理解框架使其在网页操作

AI中国 AI中国
133 0
AI视频 1周前

Speech 2.6 – MiniMax推出的语音生成模型

Speech 2.6是什么Speech 2.6 是MiniMax推出的全新语音生成模型,专为新一代语音智能体设计,具备超低延时(低于250毫秒),确保实时对话流畅;支持多种语言的网址、邮箱、电话号码等非标准文本格式的直接转换,无需繁琐预处理。模型通过 Fluent LoRA 技术,进一步提升音韵自然度和音色复刻的流利性,原始素材带有口音或不流利,也能生成高质量语音。模型适用智能客服、智能硬件等

AI中国 AI中国
205 0
AI视频 1周前

FIBO – 开源的图像生成模型,首个原生支持JSON

FIBO是什么FIBO 是首个开源的原生支持 JSON 的文本生成图像模型,专为长结构化描述训练而成。模型在超过 1 亿条结构化 JSON 描述(每条约 1,000 字)上训练,能精确、可重复地控制光线、构图、色彩与相机参数。FIBO 支持生成、精修和灵感三种模式,具备特征解耦能力,能单独调整某个属性不破坏整体场景。FIBO使用 100% 授权数据,确保合规性和法律透明性,适合专业工作流。

AI中国 AI中国
110 0
AI视频 1周前

Sonic-3 – Cartesia推出的实时语音对话模型

Sonic-3是什么Sonic-3是Cartesia最新发布的语音AI引擎,是当前市场上速度最快、最自然的实时语音对话模型。采用创新的“状态空间模型”(SSM)架构,非传统的Transformer模型,能更有效地模拟人类思维,记住对话主题和情绪,无需每次都从头分析上下文。使得Sonic-3的延迟低于100毫秒,在实时语音交互行业中处于领先地位。Sonic-3支持42种语言,覆盖全球95%的人口

AI中国 AI中国
197 0
AI视频 1周前

Composer – Cursor推出的自研编码模型

Composer是什么Composer 是Cursor推出的自研编码模型,专为低延迟的智能体式编码设计。模型生成速度极快,每秒可达 250 个 token,是同等智能模型的 4 倍,大多数任务在 30 秒内完成。Composer 通过语义搜索等工具训练,对大型代码库的理解和处理能力显著更强。模型支持调用多种工具,如代码编辑、终端命令和语义搜索,同时具备并行处理能力,可并行运行多个智能体以提升复

AI中国 AI中国
198 0
AI视频 1周前

Firefly Image 5 – Adobe推出的最新图像生成模型

Firefly Image 5是什么Firefly Image 5 是 Adobe 发布的最新图像生成模型。具备原生400万像素输出能力,能直接生成高分辨率图像,细节表现力大幅提升。在人物渲染方面,新模型优化了面部结构、肢体比例和光影逻辑,减少了常见问题,使生成的人物图像更加逼真。Firefly Image 5 引入了图层编辑功能,能智能识别图像中的不同元素并将其作为独立图层处理。创作者可以通

AI中国 AI中国
76 0
AI视频 1周前

LongCat-Video – 美团开源的视频生成模型

LongCat-Video是什么LongCat-Video是美团LongCat团队开源的136亿参数的视频生成模型,在文本到视频(Text-to-Video)、图像到视频(Image-to-Video)和视频续写(Video-Continuation)等任务上表现出色,尤其擅长高效生成高质量的长视频。模型通过多奖励强化学习优化(GRPO),在内部和公共基准测试中展现出与领先开源视频生成模型及最

AI中国 AI中国
88 0
AI视频 1周前

MiniMax M2 – MiniMax推出的Agent编程和优化模型

MiniMax M2是什么MiniMax M2是MiniMax推出的专为编程和Agent工作流优化的大语言模型。模型拥有100亿激活参数和2300亿总参数,支持204,800的上下文窗口和131,072的最大输出Token数。在通用推理、工具使用和多步任务执行方面表现出接近前沿的智能水平,同时保持了低延迟和部署效率。根据Artificial Analysis的基准测试,M2在数学、科学和指令遵

AI中国 AI中国
164 0
AI视频 1周前

Kimi CLI – Moonshot AI推出的命令行通用智能体工具

Kimi CLI是什么Kimi CLI 是 Moonshot AI 推出的命令行通用智能体工具,为开发者提供高效、便捷的编程辅助和文件处理功能。支持 macOS 和 Linux 系统,通过 uv 包管理器安装,安装过程简单快捷。首次使用时,用户需通过 /setup 元命令进行配置,输入 API Key 并选择合适的模型,如 Coding 会员可选择「Kimi For Coding」模型。Kim

AI中国 AI中国
92 0
AI绘画 1周前

Auralume AI

💡 Auralume AI 是什么?Auralume AI 是一个集成多款领先 AI 视频生成模型的 全能 AI 视频平台。它允许用户通过 文字、图片或创意描述,在几秒钟内生成 电影级视觉效果 的视频。平台整合了包括 Google Veo、Sora、Kling AI、Luma AI、Seedream、Hunyuan、Vidu AI、Pika AI 等主流 AI 模型,用户无需切换不同平台即可

AI中国 AI中国
200 0
AI视频 1周前

veo3.1

🎥 Veo 3.1 是什么?Veo 3.1 是由 Google 推出的次世代 AI 视频生成平台,基于 Veo 3.1 AI 模型 构建,支持从 文字、图片或照片 自动生成具备 声音、对白与精准口型同步 的 4K 电影级视频。这款工具将 视觉、声音与物理模拟 融合在一起,使创作者能在几分钟内完成传统视频制作需要数小时才能完成的工作。无论你是内容创作者、品牌营销人员还是影视制作者,Veo 3

AI中国 AI中国
214 0
Aibrary APP
AI工具集合 1周前

Aibrary APP

Aibrary APP的简介Aibrary是助力个人成长的AI学习应用。基于书籍而非网络碎片信息,以学习科学为基础,为终身学习者和忙碌专业人士设计,将碎片时间转化为成长时间。核心功能包括:Idea Twin Podcasts,AI以你自己的声音思考、提问和成长,像好奇的朋友和专家教练一样,挑战你的假设,激发新想法;AI Growth Team,由Nova、Orion、Atlas组成,分别负责心

AI中国 AI中国
196 0
灵光APP
AI工具集合 1周前

灵光APP

灵光APP的简介灵光是支付宝(杭州)数字服务技术有限公司开发的多模态AI应用,目前已在腾讯应用宝、vivo应用商店等平台上线,并开启了邀约内测。应用的最大亮点是其“AGI相机”功能,能通过相机镜头识别并理解现实世界中的场景与内容,实现拍摄即问、实时理解与回答。灵光APP的主要功能AGI相机 :是“灵光”的核心功能,可通过相机镜头识别并理解现实世界中的场景与内容,实现拍摄即问、实时理解与

AI中国 AI中国
81 0
加载更多

推荐文章

大语言模型也有“健忘症”?Supermemory推出“无限记忆外挂”,让你的AI永不失忆!

大语言模型也有“健忘症”?Supermemory推出“无限记忆外挂”,让你的AI永不失忆!

5月前 • AI热点
性能与效率的双赢:Qwen3横空出世,MoE架构大幅降低部署成本

性能与效率的双赢:Qwen3横空出世,MoE架构大幅降低部署成本

6月前 • AI热点
小米推出米家无线洗地机 4 Max:活水贴边清洁臂、23000Pa 吸力,国补价 2549.15 元起

小米推出米家无线洗地机 4 Max:活水贴边清洁臂、23000Pa 吸力,国补价 2549.15 元起

5月前 • AI热点
互联网女皇” Mary Meeker 发布 340 页 AI 报告 揭示行业史无前例变革速度

互联网女皇” Mary Meeker 发布 340 页 AI 报告 揭示行业史无前例变革速度

5月前 • AI热点
英伟达推出新型模型 Cosmos-Reason1 ,让 AI 更好理解物理世界

英伟达推出新型模型 Cosmos-Reason1 ,让 AI 更好理解物理世界

5月前 • AI热点
速抢(2核2G)77元/年香港免备案服务器

速抢(2核2G)77元/年香港免备案服务器

0秒前 • AI热点
跟上 ChatGPT 及 Gemini 步伐,马斯克 xAI 旗下 Grok 增加“记忆”功能

跟上 ChatGPT 及 Gemini 步伐,马斯克 xAI 旗下 Grok 增加“记忆”功能

6月前 • AI热点
用AI免费制作爆款治愈乡村小屋小院怀旧视频,条条爆款

用AI免费制作爆款治愈乡村小屋小院怀旧视频,条条爆款

7月前 • 学习教程

热门标签

年度2233位绘画大神预热 AI交互 市场销量 Gemini2.5 微软人工智能 模型测试 T-1000 XBOW 超现实操控 语音控制

热门作者

作者头像

AI前沿

2.4k 粉丝

作者头像

机器学习实验室

1.8k 粉丝

作者头像

AI创业圈

3.1k 粉丝

AI学习站

整合200+开源数据集、50个主流模型API接口、斯坦福等名校课程资源,提供从入门到专家的阶梯式学习导航。

快速链接

  • 首页
  • AI热点
  • AI教程

联系我们

  • gzhcly@qq.com

Copyright © 2025 All rights reserved. AI学习站 黔ICP备2025045649号-2

隐私政策 使用条款 免责声明