gpt-oss – OpenAI开源的推理模型系列
# AI工具,# AI项目和框架 AI视频

gpt-oss – OpenAI开源的推理模型系列

作者头像 AI中国 23小时前 105 阅读
4.8 (1280评分)
15,328人已学习

gpt-oss是什么

gpt-oss 是 OpenAI 推出的开源推理模型系列,包含 gpt-oss-120b 和 gpt-oss-20b 两个版本。gpt-oss-120b 拥有1170亿参数,激活参数约51亿,能在单张 80GB GPU 上运行;gpt-oss-20b 拥有210亿参数,激活参数约36亿,能在 16GB 内存的消费级设备(如笔记本或手机)上运行。两者均基于 MoE 架构,支持 128k上下文长度,性能接近闭源的 o4-mini 和 o3-mini,在工具调用、少样本函数调用、链式思考推理及健康问答等方面表现出色。模型基于 Apache 2.0 许可证开源,支持免费商用,为开发者提供强大的本地推理能力。

gpt-oss的主要功能

  • 工具调用:支持调用外部工具(如网页搜索、Python代码解释器)解决复杂问题,增强问题解决能力。
  • 链式思考:逐步分解复杂问题并逐步解决,适合多步骤推理任务。
  • 低资源需求:gpt-oss-20b 能在 16GB 内存设备上运行,适合消费级设备;gpt-oss-120b 能在 80GB GPU 上运行,适合高性能需求。
  • 快速推理:推理速度可达 40-50 tokens/s,适合需要快速响应的场景。
  • 开源权重:提供完整的模型权重和代码,支持本地微调和定制,满足特定任务需求。
  • 推理强度调节:支持低、中、高三种推理强度,能根据需求调整,平衡延迟与性能。

gpt-oss的技术原理

  • 模型架构:基于 Transformer 架构,用专家混合(MoE)技术减少处理输入所需的活跃参数数量,提高推理效率。基于交替的密集和局部带状稀疏注意力模式,类似于 GPT-3,进一步优化内存和计算效率。用分组多查询注意力机制,分组大小为 8,进一步提升推理效率。用 RoPE 进行位置编码,支持最长 128k 的上下文长度。
  • 预训练与后训练:预训练用高质量的纯文本数据集进行预训练,重点关注 STEM、编程和通用知识领域。后训练用与 o4-mini 类似的训练流程,包括监督式微调和高计算量的强化学习阶段。训练目标是让模型符合 OpenAI 模型规范,具备链式推理和工具调用能力。
  • 量化与优化:用 MXFP4 格式进行量化,模型在训练阶段就适应低精度环境,确保在减少模型体积的同时保持高性能。gpt-oss-20b量化后模型大小约为 12.8GB,能在 16GB 内存设备上运行。gpt-oss-120b量化后可在 80GB 内存中运行。与 NVIDIA、AMD 等硬件厂商合作,确保模型在各类系统上实现性能优化。
  • 安全机制:在预训练阶段过滤与化学、生物、放射性和核(CBRN)相关的有害数据。通过审慎对齐和指令优先级评估,训练模型拒绝不安全提示并抵御注入攻击。在特定领域(如生物学和网络安全)进行对抗性微调,评估并优化模型的安全性。

gpt-oss的性能表现

  • 基准测试表现
    • 竞赛编程:在 Codeforces 竞赛编程测试中,gpt-oss-120b 获得 2622 分,gpt-oss-20b 获得 2516 分,表现优于部分开源模型,略逊于闭源的 o3 和 o4-mini。
    • 通用问题解决:在 MMLU 和 HLE 测试中,gpt-oss-120b 表现优于 OpenAI 的 o3-mini,并接近 o4-mini 的水平。
    • 工具调用:在 TauBench 智能体评估套件中,gpt-oss-120b 和 gpt-oss-20b 的表现均优于 OpenAI 的 o3-mini,达到或超过了 o4-mini 的水平。
    • 健康问答:在 HealthBench 测试中,gpt-oss-120b 的表现超越 o4-mini, gpt-oss-20b 达到与 o3-mini 相当的水平。

gpt-oss的项目地址

  • 项目官网:https://openai.com/zh-Hans-CN/index/introducing-gpt-oss/
  • GitHub仓库:https://github.com/openai/gpt-oss
  • HuggingFace模型库:https://huggingface.co/collections/openai/gpt-oss-68911959590a1634ba11c7a4
  • 在线体验Demo:https://gpt-oss.com/

gpt-oss的应用场景

  • 本地推理与隐私保护:在隐私敏感领域(如医疗、金融),gpt-oss 能在本地设备运行,确保数据安全,同时提供强大推理能力。
  • 编程辅助与代码生成:开发者用 gpt-oss 调用工具生成和验证代码片段,显著提升编程效率,减少调试时间。
  • 智能客服与客户支持:企业部署 gpt-oss 作为智能客服,快速响应客户咨询,提供准确答案,降低人力成本。
  • 教育与学习辅导:学生借助 gpt-oss 辅助学习,解答问题、提供写作建议,提升学习效率和理解能力。
  • 创意内容生成:作家、编剧、游戏开发者等用 gpt-oss 生成创意内容,激发灵感,提升创作效率。

教程评分

4.8 (1280 人评分)

学习讨论 (42)

用户头像

初学者

2天前

非常棒的教程!

作者头像

AI导师李明 作者

1天前

多谢