OpenAI o1 真的来了，你准备好了吗？

chatgpt2024-09-19 12:58:3554

You might know it as Q* or Strawberry: the latest OpenAI LLM is here. This is everything you need to know（传说中的"草莓Ai“）

经过几个月的猜测，OpenAI最新的LLM 版本已经发布--它不叫GPT-5。在此之前，该系列的最新机型曾被冠以 Q* 和 Strawberry 等神秘而耐人寻味的代号，但最终还是采用了OpenAI o1 这一名称。

OpenAI 新模型最大的更新是增强了推理能力。OpenAI 解释说，与以前的模型相比，o1 经过训练后会花更多时间进行思考，使其更接近人类智能。

以下视频是openAi o1与以前的gpt 4/4o智力对比，吊打之前所有版本，正因为OpenAi o1的横空出世，最近两周英伟达创始人黄仁勋应该是世界上最欢乐的人。

我顺手问了一下我手头的GPT-4O模型，果真它遇到这个问题，马上被Exploit：）

OpenAI o1 是什么？

OpenAI o1 是OpenAI 于 2024 年 9 月 12 日发布的最新系列大语言机型，目前包括两款机型：o1-preview 和 o1-mini。

o1 与该公司之前型号的最大区别在于其先进的推理能力。虽然它还没有正式发布，但预览版和迷你版已经在数学、科学和编码测试中击败了GPT-4o。

九月份发布的产品包括两个型号：o1-preview 和 o1-mini。它们是一系列机型中的首批机型，随着OpenAI 对新型LLM 的不断完善，这些机型还将陆续发布。

区别是什么？o1-mini 机型比预览机型小，价格便宜 80%。它专为需要高级推理但不需要更广泛知识的场景而设计。它非常适合涉及编码或数学的任务。

OpenAI o1 的推理能力：

有关 o1 推理能力的更多信息，请参阅OpenAI 的研究报告。

o1 的新推理能力是其通用智能的核心。"也许最重要的进步领域将围绕推理能力展开，"奥特曼与盖茨分享道。"现在，GPT-4 只能以极其有限的方式进行推理。"

推理是出了名的困难。即使对人类来说也是如此。OpenAI o1 是第一个宣称这一点的模型。

o1 模型能够实时推理，而不是依赖预先训练的数据。这就是为什么新模型在科学、数学和编码任务方面比以前的OpenAI 模型更出色的原因。

随着LLMs 的普及和功能的增强，安全问题日益突出，因此安全问题成为OpenAI最新开发的重点。公司在开发 o1 系列产品时，与美国和英国的人工智能安全研究所合作，并与美国政府合作进行尽职调查。

作为一大进步，o1 系列比以前的版本更加安全--绕过安全措施。

在一项最难的越狱安全测试中，o1-preview 模型获得了 84 分（满分 100 分），而GPT-4o 则只有令人沮丧的 22 分。

虽然它的名字并不是全新OpenAI LLM 最令人兴奋的地方，但这是一个有意为之的有意义的变化。

OpenAI o1 是第一个摆脱 "GPT"称号的型号，这是因为公司声称它是全新 "推理范式 "的第一阶段，而旧型号则属于 "前训练范式"。

新模型会花时间进行实时推理，而不是依赖预训练数据。

推理能力越强，数学能力就越强。

o1 和GPT-4o 都被要求完成国际奥林匹克数学竞赛的资格考试。GPT-4o 解决了 13% 的问题，而 o1 解决了 83% 的问题

5) 等待时间较长

实时推理比引用训练数据和生成回复耗时更长。如果您向OpenAI o1-preview 提问，与其他模型相比，等待的时间要长得多。

不过，有了外包推理的能力，付出的代价还是很小的。随着 o1 系列下一个机型的发布，其速度可能会有所提高。