ChatGPT官网

OpenAI o1 真的来了,你准备好了吗?

chatgpt2024-09-19 12:58:3583

You might know it as Q* or Strawberry: the latest OpenAI LLM is here. This is everything you need to know(传说中的"草莓Ai“)

经过几个月的猜测,OpenAI最新的LLM 版本已经发布--它不叫GPT-5。 在此之前,该系列的最新机型曾被冠以 Q* 和 Strawberry 等神秘而耐人寻味的代号,但最终还是采用了OpenAI o1 这一名称。

OpenAI 新模型最大的更新是增强了推理能力。OpenAI 解释说,与以前的模型相比,o1 经过训练后会花更多时间进行思考,使其更接近人类智能。

以下视频是openAi o1与以前的gpt 4/4o智力对比,吊打之前所有版本,正因为OpenAi o1的横空出世,最近两周英伟达创始人黄仁勋应该是世界上最欢乐的人。

我顺手问了一下我手头的GPT-4O模型,果真它遇到这个问题,马上被Exploit:)

OpenAI o1 是什么?

OpenAI o1 是OpenAI 于 2024 年 9 月 12 日发布的最新系列大语言机型,目前包括两款机型:o1-preview 和 o1-mini。

o1 与该公司之前型号的最大区别在于其先进的推理能力。虽然它还没有正式发布,但预览版和迷你版已经在数学、科学和编码测试中击败了GPT-4o。

OpenAI o1 型号

九月份发布的产品包括两个型号:o1-preview 和 o1-mini。它们是一系列机型中的首批机型,随着OpenAI 对新型LLM 的不断完善,这些机型还将陆续发布。

区别是什么?o1-mini 机型比预览机型小,价格便宜 80%。它专为需要高级推理但不需要更广泛知识的场景而设计。它非常适合涉及编码或数学的任务。

OpenAI o1 有多智能?

OpenAI o1 的推理能力:

  • 在物理、化学和生物学基准测试中的表现与博士生相似。

  • 在美国数学奥林匹克竞赛美国预选赛中进入前 500 名。

  • 在竞争激烈的编码测试 Codeforces 中排名第 89 位。

有关 o1 推理能力的更多信息,请参阅OpenAI 的研究报告。

o1 与GPT-4o 有什么不同?

1) 推理能力

o1 的新推理能力是其通用智能的核心。"也许最重要的进步领域将围绕推理能力展开,"奥特曼与盖茨分享道。"现在,GPT-4 只能以极其有限的方式进行推理。"

推理是出了名的困难。即使对人类来说也是如此。OpenAI o1 是第一个宣称这一点的模型。

o1 模型能够实时推理,而不是依赖预先训练的数据。这就是为什么新模型在科学、数学和编码任务方面比以前的OpenAI 模型更出色的原因。

2) 安全性更强

随着LLMs 的普及和功能的增强,安全问题日益突出,因此安全问题成为OpenAI最新开发的重点。公司在开发 o1 系列产品时,与美国和英国的人工智能安全研究所合作,并与美国政府合作进行尽职调查。

作为一大进步,o1 系列比以前的版本更加安全--绕过安全措施。 

在一项最难的越狱安全测试中,o1-preview 模型获得了 84 分(满分 100 分),而GPT-4o 则只有令人沮丧的 22 分。

3) 新的命名规则

虽然它的名字并不是全新OpenAI LLM 最令人兴奋的地方,但这是一个有意为之的有意义的变化。

OpenAI o1 是第一个摆脱 "GPT"称号的型号,这是因为公司声称它是全新 "推理范式 "的第一阶段,而旧型号则属于 "前训练范式"。

新模型会花时间进行实时推理,而不是依赖预训练数据。

4) 更擅长科技、数学和工程学方面的问题解决任务

推理能力越强,数学能力就越强。 

o1 和GPT-4o 都被要求完成国际奥林匹克数学竞赛的资格考试。GPT-4o 解决了 13% 的问题,而 o1 解决了 83% 的问题

5) 等待时间较长

实时推理比引用训练数据和生成回复耗时更长。如果您向OpenAI o1-preview 提问,与其他模型相比,等待的时间要长得多。

不过,有了外包推理的能力,付出的代价还是很小的。随着 o1 系列下一个机型的发布,其速度可能会有所提高。

本文链接:https://dinjianwenan.top/chatgpt_233.html

openai o1模型简介OpenAI o1中文版OpenAI o1地址OpenAI o1官网OpenAI o1官网入口OpenAI o1 previewOpenAI o1 miniOpenAI o1-preview‍‍OpenAI o1-minio1-mini

相关文章