You might know it as Q* or Strawberry: the latest OpenAI LLM is here. This is everything you need to know(传说中的"草莓Ai“)
经过几个月的猜测,OpenAI最新的LLM 版本已经发布--它不叫GPT-5。 在此之前,该系列的最新机型曾被冠以 Q* 和 Strawberry 等神秘而耐人寻味的代号,但最终还是采用了OpenAI o1 这一名称。
OpenAI 新模型最大的更新是增强了推理能力。OpenAI 解释说,与以前的模型相比,o1 经过训练后会花更多时间进行思考,使其更接近人类智能。
以下视频是openAi o1与以前的gpt 4/4o智力对比,吊打之前所有版本,正因为OpenAi o1的横空出世,最近两周英伟达创始人黄仁勋应该是世界上最欢乐的人。
OpenAI o1 是什么?
OpenAI o1 是OpenAI 于 2024 年 9 月 12 日发布的最新系列大语言机型,目前包括两款机型:o1-preview 和 o1-mini。
o1 与该公司之前型号的最大区别在于其先进的推理能力。虽然它还没有正式发布,但预览版和迷你版已经在数学、科学和编码测试中击败了GPT-4o。
OpenAI o1 型号
九月份发布的产品包括两个型号:o1-preview 和 o1-mini。它们是一系列机型中的首批机型,随着OpenAI 对新型LLM 的不断完善,这些机型还将陆续发布。
区别是什么?o1-mini 机型比预览机型小,价格便宜 80%。它专为需要高级推理但不需要更广泛知识的场景而设计。它非常适合涉及编码或数学的任务。
OpenAI o1 有多智能?
OpenAI o1 的推理能力:
在物理、化学和生物学基准测试中的表现与博士生相似。
在美国数学奥林匹克竞赛美国预选赛中进入前 500 名。
在竞争激烈的编码测试 Codeforces 中排名第 89 位。
有关 o1 推理能力的更多信息,请参阅OpenAI 的研究报告。
o1 与GPT-4o 有什么不同?
1) 推理能力
o1 的新推理能力是其通用智能的核心。"也许最重要的进步领域将围绕推理能力展开,"奥特曼与盖茨分享道。"现在,GPT-4 只能以极其有限的方式进行推理。"
推理是出了名的困难。即使对人类来说也是如此。OpenAI o1 是第一个宣称这一点的模型。
o1 模型能够实时推理,而不是依赖预先训练的数据。这就是为什么新模型在科学、数学和编码任务方面比以前的OpenAI 模型更出色的原因。
2) 安全性更强
随着LLMs 的普及和功能的增强,安全问题日益突出,因此安全问题成为OpenAI最新开发的重点。公司在开发 o1 系列产品时,与美国和英国的人工智能安全研究所合作,并与美国政府合作进行尽职调查。
作为一大进步,o1 系列比以前的版本更加安全--绕过安全措施。
在一项最难的越狱安全测试中,o1-preview 模型获得了 84 分(满分 100 分),而GPT-4o 则只有令人沮丧的 22 分。
3) 新的命名规则
虽然它的名字并不是全新OpenAI LLM 最令人兴奋的地方,但这是一个有意为之的有意义的变化。
OpenAI o1 是第一个摆脱 "GPT"称号的型号,这是因为公司声称它是全新 "推理范式 "的第一阶段,而旧型号则属于 "前训练范式"。
新模型会花时间进行实时推理,而不是依赖预训练数据。
4) 更擅长科技、数学和工程学方面的问题解决任务
推理能力越强,数学能力就越强。
o1 和GPT-4o 都被要求完成国际奥林匹克数学竞赛的资格考试。GPT-4o 解决了 13% 的问题,而 o1 解决了 83% 的问题
5) 等待时间较长
实时推理比引用训练数据和生成回复耗时更长。如果您向OpenAI o1-preview 提问,与其他模型相比,等待的时间要长得多。
不过,有了外包推理的能力,付出的代价还是很小的。随着 o1 系列下一个机型的发布,其速度可能会有所提高。
本文链接:https://dinjianwenan.top/chatgpt_233.html
openai o1模型简介OpenAI o1中文版OpenAI o1地址OpenAI o1官网OpenAI o1官网入口OpenAI o1 previewOpenAI o1 miniOpenAI o1-previewOpenAI o1-minio1-mini