重磅发布：OpenAI o1系列模型

chatgpt2024-09-13 02:28:2857

‍

‍OpenAI在北京时间9月13日的凌晨，更新了o1系列模型。主要包含o1-mini、o1-preview 。

从今天开始，ChatGPTPlus和Team用户将能够访问ChatGPT中的o1模型。o1-preview和o1-mini都可以在模型选择器中手动选择，在发布时，o1-preview 的每周速率限制为30条消息，o1-mini的每周速率限制为50条。我们正在努力提高这些速率，并使ChatGPT能够针对给定的提示自动选择正确的模型

关于新模型的介绍：

我们开发了一系列新的人工智能模型，旨在让它们在做出反应之前花更多的时间思考。它们可以通过复杂的任务进行推理，解决比以前的科学、编码和数学模型更难的问题。

OpenAI o1-preview 先行版

这个先行版模型经过特别设计，能够在回应之前进行更深入的推理，因此它能够处理比之前AI更复杂的任务。不论是科学领域的难题，还是编程、数学等技术挑战，o1-preview都展现出了超越以往的解决能力。它的核心在于应对复杂问题时更具逻辑性和耐心。

OpenAI o1-mini：轻量级的强大AI

如果你对数学和编程感兴趣，那么o1-mini无疑会成为你关注的焦点。它专注于STEM领域（科学、技术、工程、数学），尤其在数学和编程方面表现尤为出色。虽然比起完整版的o1-preview，o1-mini更加轻量级，但它在像AIME和Codeforces等专业评估基准上的表现几乎与o1持平。对于需要推理但不涉及广泛知识的应用，o1-mini是一款既快速又经济的AI选择。

数学：在高中 AIME 数学竞赛中，o1-mini（70.0%）与 o1（74.4%）相当，同时价格便宜得多，且成绩优于 o1-preview（44.6%）。o1-mini 的得分（约 11/15 个问题）大约位列美国高中生前 500 名。

编码：在 Codeforces 竞赛网站上，o1-mini 的 Elo 得分为 1650，与 o1（1673）不相上下，且高于 o1-preview（1258）。这一 Elo 得分使该模型在 Codeforces 平台上竞争的程序员中处于第 86 个百分位左右。o1-mini 在 HumanEval 编码基准和高中级网络安全夺旗挑战赛 (CTF) 中也表现出色。

从图中不难看出，代码和安全都有很大的提升。