AI News

OpenAI发布GPT-OSS：两款震撼业界的开源大模型

Published on August 7, 2025

#OpenAI#GPT-OSS#Open Source#Large Language Models#AI Safety#Mixture of Experts#GPT-5

Cover for OpenAI发布GPT-OSS：两款震撼业界的开源大模型

OpenAI 突然发布了两款名为 GPT-OSS 的开源、开放权重的大型语言模型，此举对 AI 社区产生了巨大影响。

主要亮点：

模型详情: 发布了一个 1200 亿参数的大模型和一个 200 亿参数的小模型。两者均采用高效的混合专家（MoE）架构。
顶级性能: 120B 模型在推理和编码等关键任务上，其性能表现几乎与 OpenAI 自家的 GPT-3.5-Turbo 和 GPT-4-Mini 等优秀闭源模型持平。
商业友好: 模型遵循 Apache 2.0 许可证，完全允许商业使用，为开发者和企业构建应用提供了极大的自由度。
硬件要求低: 120B 大模型可在单张 80GB GPU 上运行，而 20B 小模型仅需 16GB 内存，使其能够在消费级硬件和边缘设备上进行本地部署。

技术与安全：

模型采用了与 OpenAI 顶级模型（如 GPT-4）相同的先进训练技术，特别是强化学习方法。在 AI 安全方面，OpenAI 承认开放权重模型存在无法撤回的固有风险。因此，他们特意未对模型的“思维链”进行惩罚性监督，以防模型学会隐藏不良意图，并鼓励社区对此进行研究。

战略意义：

这次发布被视为一个重要的“剧情反转”，不仅重新确立了 OpenAI 的“开放”形象，也极大地提升了外界对即将发布的 GPT-5 的期望——它必须在性能上远超这些开源模型。此举也被看作是美国在与全球（特别是中国）的开源 AI 竞争中，巩固其领导地位的关键一步。