AI学习站
首页 AI热点 AI教程
用户头像

标准会员

会员时间

积分 0

历史 通知(0)
首页
AI动态
技术前沿
工具与教程
大模型
AI投资分析
AI落地
AI政策法规

登录账号

忘记密码?

还没有账号? 立即注册

我已阅读并同意用户协议和隐私政策

已有账号? 立即登录

InternVLA·M1 – 上海AI Lab开源的具身双系统操作大模型
Top
AI视频 18小时前 • 68

InternVLA·M1 – 上海AI Lab开源的具身双系统操作大模型

InternVLA·M1是什么InternVLA·M1 是上海人工智能实验室开发的具身操作“大脑”,是面向指令跟随的双系统操作大模型。构建了覆盖“思考-行动-自主学习”的完整闭环,负责高阶的空间推理与任务规划。模型采用两阶段训练策略,先通过空间感知预训练,增强空间推理与规划能力;再以隐式空间推理方式实现高效的动作后训练。仅需“空间规划提示”即可高效训练,大幅降低成本。在 SimplerEnv

AI中国
AI中国

Read more
Qwen3-235B-A22B-Thinking-2507 – 阿里推出的最新推理模型
AI视频 1月前

Qwen3-235B-A22B-Thinking-2507 – 阿里推出的最新推理模型

Qwen3-235B-A22B-Thinking-2507是什么Qwen3-235B-A22B-Thinking-2507 是阿里巴巴发布的全球最强开源推理模型。基于2350亿参数的稀疏混合专家(MoE)架构,每次激活220亿参数,拥有94层Transformer网络和128个专家节点。模型专为复杂推理任务设计,支持256K原生上下文处理能力,可应对长文本和深度推理链。在性能方面,Qwen3-

AI中国 AI中国
76 0
Coze Studio – 字节跳动开源的AI Agent开发平台
AI视频 1月前

Coze Studio – 字节跳动开源的AI Agent开发平台

Coze Studio是什么Coze Studio(扣子开发平台)是字节跳动开源的AI智能体开发平台,帮助开发者快速构建、部署和管理AI智能体。提供一站式开发环境,支持Prompt、RAG、Plugin、Workflow等核心技术,通过可视化工作流编排,开发者可以零代码或低代码开发复杂AI应用。平台内置插件框架,可将第三方API或私有能力封装为插件,扩展智能体功能。Coze Studio采用G

AI中国 AI中国
93 0
Step 3 – 阶跃星辰最新推出的多模态推理模型
AI视频 1月前

Step 3 – 阶跃星辰最新推出的多模态推理模型

Step 3是什么Step 3 是阶跃星辰最新发布的新一代基础大模型,专为推理时代设计,兼具高性能与极致成本效益。采用 MoE 架构,拥有 321B 总参数量 和 38B 激活参数量,是首个全尺寸、原生多模态推理模型,具备强大的视觉感知和复杂推理能力,能在多个领域实现高效应用。通过 AFD 分布式推理系统 和 MFA 注意力机制,实现了推理效率的大幅提升。在国产芯片上,推理效率可达同类模型的

AI中国 AI中国
200 0
Higgs Audio V2 – 开源语音大模型,能模拟多人互动场景
AI视频 1月前

Higgs Audio V2 – 开源语音大模型,能模拟多人互动场景

Higgs Audio V2是什么Higgs Audio V2 是李沐及其团队 Boson AI 开发的开源语音大模型。基于超过1000万小时的音频数据训练而成,具备多语言对话生成、自动韵律调整、语音克隆和歌声合成等功能。模型能模拟自然流畅的多人对话,自动匹配说话者的情绪和语调,支持低延迟的实时语音交互。支持零样本语音克隆,用户只需提供简短语音样本,即可复制特定人物的声音特征,可以合成歌声。H

AI中国 AI中国
204 0
Agentar-Fin-R1 – 蚂蚁数科推出的金融推理大模型
AI视频 1月前

Agentar-Fin-R1 – 蚂蚁数科推出的金融推理大模型

Agentar-Fin-R1是什么Agentar-Fin-R1 是蚂蚁数科推出的专门面向金融领域的大型语言模型,提升金融场景中的推理能力、可信度和领域专长。模型基于 Qwen3 基础模型开发,提供 8B 和 32B 参数版本,通过精细化的金融任务标签体系和多层可信度保障框架进行优化。在数据构造上采用标签驱动的三级流水线,确保数据来源可信、合成可信和治理可信。模型在金融基准测试(如 Fineva

AI中国 AI中国
102 0
MonkeyCode – 开源的企业级本地AI编程助手
AI视频 1月前

MonkeyCode – 开源的企业级本地AI编程助手

MonkeyCode是什么MonkeyCode 是开源的企业级 AI 编程助手,支持私有化部署和离线使用,保障代码隐私与安全。MonkeyCode 兼容多种本地化大模型,具备代码补全、自然语言编程、代码安全扫描等功能,配备企业级管理面板,支持对 AI 编程行为进行严格审计和管控。MonkeyCode 安装便捷,基于 Docker 运行,适合注重隐私和安全的开发团队,提升研发效率并保障代码质量。

AI中国 AI中国
85 0
SuperDesign – 开源AI设计Agent,并行生成多个设计选项
AI视频 1月前

SuperDesign – 开源AI设计Agent,并行生成多个设计选项

SuperDesign是什么SuperDesign 是开源AI设计Agent,帮助设计师和开发者在 IDE 中直接生成 UI 原型、组件和线框图。工具支持自然语言输入,能并行生成多个设计选项,方便用户快速探索不同创意。SuperDesign 支持与 Cursor、Windsurf、Claude Code 和 VS Code 等主流 AI 编辑器无缝集成,支持设计变体管理、快速迭代和本地存储。工

AI中国 AI中国
111 0
KAT-V1 – 快手开源的自动思考模型
AI视频 1月前

KAT-V1 – 快手开源的自动思考模型

KAT-V1是什么KAT-V1是快手开源的自动思考(AutoThink)大模型,包含40B和200B两个版本。模型融合思考与非思考能力,能根据问题难度自动切换思考模式。40B版本性能逼近DeepSeek-R1(6850亿参数),200B版本在多项基准测试中超越Qwen、DeepSeek和Llama等开源模型。KAT-V1用长短思考混合训练范式和新型强化学习方法Step-SRPO,提升思考密度和

AI中国 AI中国
198 0
Qwen-MT – 阿里通义千问推出的机器翻译模型
AI视频 1月前

Qwen-MT – 阿里通义千问推出的机器翻译模型

Qwen-MT是什么Qwen-MT 是阿里通义千问团队推出的机器翻译模型,基于强大的 Qwen3 架构开发。模型支持 92 种语言的高质量互译,覆盖全球 95% 以上的人口,能满足多样化的跨语言交流需求。模型基于轻量级 MoE 架构,具备低延迟和低成本的特点,每百万输出 token 的 API 调用成本低至 0.5 美元。模型支持术语干预、领域提示和翻译记忆等功能,能根据用户需求定制翻译风格。

AI中国 AI中国
169 0
Seed LiveInterpret 2.0 – 字节跳动Seed推出的同声传译模型
AI视频 1月前

Seed LiveInterpret 2.0 – 字节跳动Seed推出的同声传译模型

Seed LiveInterpret 2.0是什么Seed LiveInterpret 2.0 是字节跳动Seed团队推出的端到端同声传译模型,支持中英双向翻译。具备接近真人水平的翻译准确率和极低的延迟,能实现“边听边说”的实时翻译。模型基于全双工语音生成理解框架,支持多人语音输入,可实时复刻说话人的音色,无需提前采集声音样本。在复杂场景下,翻译准确率超70%,单人演讲时超80%。平均语音到语

AI中国 AI中国
184 0
AI视频 1月前

UP简历

UP简历是什么?UP简历是一款AI智能简历SaaS工具,旨在帮助学生和职场新人轻松创建专业且引人注目的简历。通过使用前沿的AI技术,UP简历简化了繁琐的简历制作过程,提供了一次简单、高效且充满成就感的智能体验。UP简历应用场景学生求职:帮助学生创建第一份简历,突出教育背景和潜在能力。职场新人:为初入职场的新人提供简历制作指导,提升求职成功率。职业转换:助力职业发展和工作领域转换的专业

AI中国 AI中国
139 0
OxyGent – 京东零售开源的多智能体协作框架
AI视频 1月前

OxyGent – 京东零售开源的多智能体协作框架

OxyGent是什么OxyGent是京东零售Oxygen团队开源的多智能体协作框架,能帮助开发者高效组装多智能体系统。OxyGent将工具、模型和智能体抽象为可插拔的模块(Oxy),支持像搭积木一样灵活组合,具备极致可扩展性和全链路决策追溯能力。基于团队协作式界面,开发者能像与真实队友交流一样分配任务,智能体自动响应并反馈结果。OxyGent支持智能体认知可视化、性能剖析和持续进化,助力开发者

AI中国 AI中国
142 0
Qwen3-Coder – 阿里通义千问推出的代码生成模型
AI视频 1月前

Qwen3-Coder – 阿里通义千问推出的代码生成模型

Qwen3-Coder是什么Qwen3-Coder 是阿里通义千问团队推出的强大代码生成模型,拥有 480B 参数和 35B 激活参数,支持原生 256K token 上下文,支持扩展达到 1M token。模型在 Agentic Coding、Agentic Browser-Use 和 Agentic Tool-Use 等任务上表现卓越,达到开源模型的顶尖水平。Qwen3-Coder 基于大

AI中国 AI中国
105 0
Mureka V7 – 昆仑万维推出的最新AI音乐生成模型
AI视频 1月前

Mureka V7 – 昆仑万维推出的最新AI音乐生成模型

Mureka V7是什么Mureka V7是昆仑万维推出的先进的AI音乐模型,具备强大的音乐创作能力。模型基于MusiCoT(音乐思维链)技术,先规划整体音乐结构再填充细节,生成的音乐更具连贯性和艺术性。Mureka V7支持10种语言,能创作流行、摇滚、电子等多种风格的歌曲和纯音乐,支持用文字描述生成专属音色。用户能在简单模式快速创作,或在高级模式下上传参考歌曲实现风格定制。Mureka V

AI中国 AI中国
173 0
Seed GR-3 – 字节跳动推出通用机器人模型
AI视频 1月前

Seed GR-3 – 字节跳动推出通用机器人模型

Seed GR-3是什么Seed GR-3 是字节跳动 Seed 团队推出的通用机器人模型,具备高泛化能力、长程任务处理能力和柔性物体操作能力。Seed GR-3融合视觉 – 语言 – 动作信息的“大脑”、三合一数据训练法(机器人数据、VR 人类轨迹数据、公开图文数据)及定制的灵活“身体”ByteMini,实现对新物体、新环境和复杂指令的理解与执行。GR-3 在长序列任务、双臂协同操作和柔性物

AI中国 AI中国
115 0
OpenBB – 开源AI金融分析平台,一键获取期权异动
AI视频 1月前

OpenBB – 开源AI金融分析平台,一键获取期权异动

OpenBB是什么OpenBB 是开源的金融平台,支持为个人和企业提供强大的投资研究工具。平台集成股票、期权、加密货币、外汇、宏观经济和固定收益等多种金融数据,支持用 Python 接口和命令行界面快速调用数据。OpenBB 提供企业级可视化界面(OpenBB Workspace),支持本地部署和 AI 功能,确保数据安全与隐私。OpenBB 目标是用开源的力量,打破专业金融数据的壁垒,让任何

AI中国 AI中国
132 0
OpenReasoning-Nemotron – 英伟达开源的系列推理模型
AI视频 1月前

OpenReasoning-Nemotron – 英伟达开源的系列推理模型

OpenReasoning-Nemotron是什么OpenReasoning-Nemotron是英伟达开源的一系列推理能力强大的大型语言模型(LLM),基于DeepSeek R1 0528 模型蒸馏而成,参数规模涵盖1.5B、7B、14B和32B。模型专注于数学、科学和代码领域的推理任务,基于大规模数据蒸馏和有监督微调(SFT)训练,在多个基准测试中创下新纪录,数学上,更是超越了o3,展现出卓

AI中国 AI中国
137 0
Seed-X – 字节跳动开源的多语言翻译模型
AI视频 1月前

Seed-X – 字节跳动开源的多语言翻译模型

Seed-X是什么Seed-X是字节跳动Seed团队推出的开源多语言翻译模型,拥有70亿参数,支持28种语言的双向翻译。Seed-X通过高质量的多语言数据预训练、指令微调和强化学习相结合的方式,显著提升翻译能力,在处理复杂语言模式和生硬翻译时表现出色。Seed-X在自动评估和人工评估中均表现出色,与超大型模型如GPT-4、Claude-3.5等相当甚至更好。Seed-X推出挑战性测试集Seed

AI中国 AI中国
211 0
JoyAgent-JDGenie – 京东开源的通用多智能体系统
AI视频 1月前

JoyAgent-JDGenie – 京东开源的通用多智能体系统

JoyAgent-JDGenie 是什么 JoyAgent-JDGenie是京东开源的首个高完成度轻量化通用多智能体产品,作为完整的端到端智能体系统,无需二次开发能直接使用,支持多种任务处理,如生成报告、分析数据等。JoyAgent-JDGenie通用性强,支持用户用挂载子智能体或工具快速扩展功能。在 GAIA 榜单上,准确率高达75.15%,超越多个行业知名产品。产品具备多智能体设计模式、跨任

AI中国 AI中国
135 0
雾象Fogsight – AI动画生成Agent,输入主题生成完整叙事动画
AI视频 2月前

雾象Fogsight – AI动画生成Agent,输入主题生成完整叙事动画

雾象Fogsight是什么雾象Fogsight是大型语言模型(LLM)驱动的动画生成智能体,用户输入抽象概念或词语,能生成高水平的生动动画。核心功能包括“概念即影像”,能将输入的主题转化为叙事完整的动画,包含双语旁白和电影级视觉质感;“智能编排”,利用LLM驱动的编排能力自动完成创作流程;以及“语言用户界面(LUI)”,支持用户通过多轮对话对动画进行精准调优和迭代。雾象Fogsight的主

AI中国 AI中国
114 0
ChatFlow – 开源的AI工作流自动化工具
AI视频 2月前

ChatFlow – 开源的AI工作流自动化工具

ChatFlow是什么ChatFlow 是开源的简易工作流引擎,支持将用户设计的高质量流程与 AI 的生成能力相结合。ChatFlow支持可视化组件和自动化执行,能帮助开发人员快速生成代码、测试用例,辅助写作和系统设计。基于 ClickPrompt 提供的界面,用户能轻松操作,实现从模糊需求到具体实现的自动化转换。ChatFlow 开源且易于扩展,适合开发者、写作人员和任何需要高效工作流的用户

AI中国 AI中国
147 0
MirageLSD – Decart AI推出的实时视频生成模型
AI视频 2月前

MirageLSD – Decart AI推出的实时视频生成模型

MirageLSD是什么MirageLSD 是 Decart AI 团队推出的全球首个 Live-Stream Diffusion(实时流扩散)AI 视频模型,能实现无限时长的实时视频生成,延迟低至 40 毫秒以内,支持 24 帧/秒的流畅输出。通过 Diffusion Forcing 技术和历史增强训练,解决了传统自回归模型在长时间生成中的误差累积问题,实现了视频的无限生成。基于Hopper

AI中国 AI中国
216 0
AI视频 2月前

推推侠

推推侠是什么?推推侠是一款专为跨境电商和TikTok卖家量身打造的TikTok达人建联神器,由杭州翠柳科技有限公司开发。它通过AI算法与RPA技术,精准识别、智能扩展并高效连接高潜达人和爆单达人,实现从“广撒网”到“精准爆破”的营销协同,极大地提高了品牌出海的投放效率和达人转化成功率。推推侠应用场景推推侠在以下场景中尤为出色:跨境电商卖家找达人带货:精准匹配适合自家产品的达人,快速提高

AI中国 AI中国
183 0
AI视频 2月前

VidAU

VidAU AI 是什么?VidAU AI 是一款由 VidAU Technology Limited 推出的 AI 视频广告生成平台,专为品牌、商家与营销人员打造,旨在通过人工智能自动生成高转化率的视频广告,无需剪辑技能、无需拍摄团队,一站式完成从脚本创作到视频制作的全过程。它整合了 AI 头像(Avatar)演绎、GPT-4o 编剧、AI 语音合成、字幕/水印移除、多语种翻译等功能,是现

AI中国 AI中国
104 0
AI视频 2月前

绘想

🔍 绘想是什么?绘想(Huixiang)是百度推出的AI视频创作平台,依托其自研的多模态视频生成大模型 MuseSteamer,为用户提供从文本、图像到视频的自动创作能力。绘想支持1080P高清输出,可在30秒内生成一段拥有电影镜头语言、连贯人物动态的短视频,并搭配自动生成的音效与配音,极大地降低了内容创作门槛。该平台结合灵感推荐、一键同款等高效创作工具,为企业、自媒体、教育、游戏等行业提供

AI中国 AI中国
107 0
AI视频 2月前

Clothes Swap AI

Clothes Swap AI 是什么?Clothes Swap AI 是一个基于人工智能的虚拟试衣平台,用户只需上传自己的照片,即可实时模拟试穿各种服装。这一平台通过先进的AI图像处理技术,将用户的身形与目标服装进行精准匹配,生成极具真实感的换装效果图。无论是休闲装、正装还是裙装,都可以轻松试穿、自由切换,彻底革新了线上购物体验。Clothes Swap AI 应用场景👗 电商购物前试

AI中国 AI中国
137 0
AI视频 2月前

Kimi K2

Kimi K2 是什么?Kimi K2 是由 Moonshot AI 推出的新一代开源 AI 助手,具备 1 万亿总参数(1T) 和 32B 激活 MoE 模型,在数学推理、代码编写、多模态理解等方面表现卓越。该模型基于 MuonClip 技术预训练,处理了高达 15.5 万亿 tokens,无训练突刺,代表了大模型训练的顶尖水平。Kimi K2 被誉为类 Claude 4 和 GPT-4.

AI中国 AI中国
210 0
AI视频 2月前

信风AI外贸获客智能体

🌐 信风是什么?信风AI(TradeWind AI)是一款专为中国外贸企业打造的AI智能获客系统。它基于Deepseek大模型训练,融合30年制造业进出口实操数据,能自动化搜索全球亿万级企业信息,精准推荐潜在客户,实现“地图找客户 + AI写开发信 + AI打电话” 的一站式外贸拓客流程。信风不仅能完成高效线索挖掘,还具备多语种翻译、跨平台营销文案生成、Whatsapp与邮件自动跟进、CRM集

AI中国 AI中国
119 0
AI视频 2月前

出海匠

🚀 出海匠是什么?出海匠是一站式跨境电商数据平台,专注服务于TikTok Shop 商家、达人、MCN机构、品牌方和广告主。它通过 “数据洞察 + AI辅助工具” 双引擎,提供从选品分析、店铺运营、达人合作、直播监控、视频内容创作到广告效果评估的完整解决方案。旗下智能助手「小匠 AI」是业内首个专为TikTok电商打造的AI运营智能体。🧩 出海匠应用场景🛍️ 跨境卖家:追踪热销品类、竞品

AI中国 AI中国
207 0
AI视频 2月前

AI Prompt Generator

🤖 AI Prompt Generator 是什么?AI Prompt Generator 是一个面向所有AI用户的免费AI提示词生成工具,可以帮助你将模糊或简单的想法转化为专业、结构清晰、语义明确的提示词(Prompt),以便在各种AI平台(如 ChatGPT、Claude、Midjourney、Stable Diffusion、DALL·E、Flux 等)中获得更精准、更高质量的输出。无

AI中国 AI中国
188 0
加载更多

推荐文章

GPT-5 在数学竞赛中得了 100 分,但 OpenAI 的图表有待改进

GPT-5 在数学竞赛中得了 100 分,但 OpenAI 的图表有待改进

1月前 • AI热点
直播倒计时,OpenAI 最强模型 GPT-5 有望北京时间明日凌晨 1 点发布

直播倒计时,OpenAI 最强模型 GPT-5 有望北京时间明日凌晨 1 点发布

1月前 • AI热点
视频成本更低!MiniMax Hailuo 02用户基准测试中超越Google Veo 3

视频成本更低!MiniMax Hailuo 02用户基准测试中超越Google Veo 3

3月前 • AI热点
DeepSeek R1 推理性能提升 3.8 倍,AMD 发布下一代开源软件栈技术 ROCm 7

DeepSeek R1 推理性能提升 3.8 倍,AMD 发布下一代开源软件栈技术 ROCm 7

3月前 • AI热点
AI Agent 托管 RTA:信贷获客的无人驾驶时代

AI Agent 托管 RTA:信贷获客的无人驾驶时代

3周前 • AI热点
谷歌未来两年将在美投资 250 亿美元,用于 AI 数据中心建设

谷歌未来两年将在美投资 250 亿美元,用于 AI 数据中心建设

2月前 • AI热点
途牛上线“AI助手小牛”:开源大模型加持,一站式智能出行服务开启

途牛上线“AI助手小牛”:开源大模型加持,一站式智能出行服务开启

5月前 • AI热点
速抢(2核2G)77元/年香港免备案服务器

速抢(2核2G)77元/年香港免备案服务器

0秒前 • AI热点

热门标签

人类智能对比 AI写真 大模型创新 智能网联汽车 AIbase AI情感交互 WWDC 国际仲裁学会(Ciarb) dots.llm1 谷歌垄断案件

热门作者

作者头像

AI前沿

2.4k 粉丝

作者头像

机器学习实验室

1.8k 粉丝

作者头像

AI创业圈

3.1k 粉丝

AI学习站

用AI颠覆视频创作!学习如何通过AI生成视频脚本、自动剪辑、添加特效与字幕,掌握低成本制作高质量宣传片、短视频、动画的全流程技巧,提升创作效率10倍。

快速链接

  • 首页
  • AI热点
  • AI教程

联系我们

  • gzhcly@qq.com

Copyright © 2025 All rights reserved. AI学习站 黔ICP备2025045649号-2

隐私政策 使用条款 免责声明