AI News

OpenAI发布GPT-OSS:两款震撼业界的开源大模型

Published on August 7, 2025

#OpenAI#GPT-OSS#Open Source#Large Language Models#AI Safety#Mixture of Experts#GPT-5
Cover for OpenAI发布GPT-OSS:两款震撼业界的开源大模型

OpenAI 突然发布了两款名为 GPT-OSS 的开源、开放权重的大型语言模型,此举对 AI 社区产生了巨大影响。

主要亮点:

  • 模型详情: 发布了一个 1200 亿参数的大模型和一个 200 亿参数的小模型。两者均采用高效的混合专家(MoE)架构。
  • 顶级性能: 120B 模型在推理和编码等关键任务上,其性能表现几乎与 OpenAI 自家的 GPT-3.5-Turbo 和 GPT-4-Mini 等优秀闭源模型持平。
  • 商业友好: 模型遵循 Apache 2.0 许可证,完全允许商业使用,为开发者和企业构建应用提供了极大的自由度。
  • 硬件要求低: 120B 大模型可在单张 80GB GPU 上运行,而 20B 小模型仅需 16GB 内存,使其能够在消费级硬件和边缘设备上进行本地部署。

技术与安全:

模型采用了与 OpenAI 顶级模型(如 GPT-4)相同的先进训练技术,特别是强化学习方法。在 AI 安全方面,OpenAI 承认开放权重模型存在无法撤回的固有风险。因此,他们特意未对模型的“思维链”进行惩罚性监督,以防模型学会隐藏不良意图,并鼓励社区对此进行研究。

战略意义:

这次发布被视为一个重要的“剧情反转”,不仅重新确立了 OpenAI 的“开放”形象,也极大地提升了外界对即将发布的 GPT-5 的期望——它必须在性能上远超这些开源模型。此举也被看作是美国在与全球(特别是中国)的开源 AI 竞争中,巩固其领导地位的关键一步。

Source: OpenAI Announcement