OpenAI发布重磅新模型o1

chatgpt2024-09-14 18:26:22602

背景

OpenAI在2024.09.12发布了全新系列的大模型o1。

o1通过强化学习来进行训练，最大亮点是可以处理复杂的逻辑推理任务，在科学、代码和数学相关回答上表现更好。

o1给出回答前会耗费更多的时间做思考，因此响应时间比GPT-4系列要长一些。

模型表现

我们来看看o1模型对比gpt4o的表现：

可以明显看到，在数学、代码生成、科学和逻辑推理等方面，o1要明显强于gpt4o。

o1模型揭秘

OpenAI训练这些模型在回答问题之前花更多时间进行思考，就像人类会做的那样。

通过训练，他们学会了优化他们的思考过程、尝试不同策略，并且认识到他们的错误。

在测试中，o1的下一个模型更新在物理、化学和生物学中的挑战性基准任务上的表现与博士生相似。

o1在数学和编程上表现出色。在国际数学奥林匹克竞赛（IMO）的资格考试中，GPT-4o只正确解决了13%的问题，而推理模型的得分为83%。它们的编码能力在竞赛中被评估，在Codeforces比赛中达到了第89百分位。

作为一个早期模型，它还没有很多使ChatGPT实用的功能，如浏览网页获取信息以及上传文件和图片。对于许多常见情况，GPT-4o在近期内将更加有能力。

但是对于复杂的推理任务，这是一个重大进步，代表了AI能力的新水平。

鉴于此，OpenAI决定将大模型命名的计数器重置为1，并将这个系列命名为OpenAI o1。

模型安全

在开发这些新模型的过程中，OpenAI提出了一种新的安全训练方法，该方法利用模型的推理能力使它们遵守安全和一致性指南。

通过在上下文中对安全规则进行推理，o1模型可以更有效地应用这些安全规则。

衡量模型是否安全的一种方式是测试如果用户试图绕过模型（被称为“越狱”），那模型在多大程度上继续遵循其安全规则。

在最困难的越狱测试之一中，GPT-4o得分为22（在0-100的范围内），而o1模型得分为84，遥遥领先。

为了推进对AI安全的承诺，OpenAI最近与美国和英国的AI安全研究所正式达成了协议，协议包括向这些研究所提前提供该模型研究版本的访问权限。

o1模型的用户群体

如果你在科学、编程、数学和类似领域解决复杂问题，这些增强的推理能力可能特别有用。

例如，o1可以被医疗研究人员用来标注细胞测序数据，被物理学家用来生成量子光学所需的复杂数学公式，以及被各个领域的开发者用来构建和执行多步骤工作流程。

OpenAI o1-mini

o1系列在准确生成和调试复杂代码方面表现出色。

为了为开发者提供一个更高效的解决方案，OpenAI还推出了OpenAI o1-mini^[1]，这是一个更快、更便宜的推理模型，特别擅长编码。

作为一个较小的模型，o1-mini的成本比o1-preview低80%，使其成为一个强大而经济高效的模型，适用于需要推理但不需要广泛世界知识的应用。

如何使用OpenAI o1

ChatGPT Plus和Team用户已经可以在ChatGPT中直接使用o1模型。

o1-preview和o1-mini都可以在模型选择器中手动选择。

o1目前处于刚上线阶段，每周的使用限制是o1-preview 30条消息，o1-mini 50条消息。

OpenAI正在努力提高使用上限，并使ChatGPT能够自动为给定的prompt选择合适的模型。

ChatGPT Enterprise和Edu用户将从下周开始获得两种模型的访问权限。

Tier 5^[2]条件的API开发者今天就可以开始使用这两种模型的API。

TIER	QUALIFICATION	USAGE LIMITS
Free	User must be in an allowed geography^[3]	$100 / month
Tier 1	$5 paid	$100 / month
Tier 2	$50 paid and 7+ days since first successful payment	$500 / month
Tier 3	$100 paid and 7+ days since first successful payment	$1,000 / month
Tier 4	$250 paid and 14+ days since first successful payment	$5,000 / month
Tier 5	$1,000 paid and 30+ days since first successful payment	$50,000 / month

API调用速率限制为每分钟20次请求。OpenAI在进行额外测试后正在努力增加这些限制。

注意： o1-preview和o1 mini的API当前不包括函数调用、流式处理、对系统消息的支持以及其他功能。要开始，请查看API文档^[4]。

后续OpenAI计划为所有ChatGPT 免费用户提供o1-mini的访问权限。

OpenAI下一步工作

OpenAI会进一步迭代o1模型，还会添加上网、文件和图像上传等功能，使o1对每个人都更加有用。

除了这个全新的o1系列模型之外，OpenAI还会继续开发和发布GPT系列模型，并不会抛弃GPT系列模型，开发者不用担心。

总结

文章和示例代码开源在GitHub: GPT实战教程^[5]，可以看到所有主流的开源LLM。

公众号：coding进阶。关注公众号可以获取最新GPT实战内容。

个人网站：Jincheng's Blog^[6]。

知乎：无忌^[7]。

References

https://openai.com/index/introducing-openai-o1-preview/
https://openai.com/index/learning-to-reason-with-llms/
https://openai.com/index/openai-o1-system-card/

参考资料

[1]

OpenAI o1-mini: https://openai.com/index/openai-o1-mini-advancing-cost-efficient-reasoning/

[2]

Tier 5: https://platform.openai.com/docs/guides/rate-limits/usage-tiers

[3]

allowed geography: https://platform.openai.com/docs/supported-countries

[4]

API文档: http://platform.openai.com/docs/guides/reasoning

本文链接：https://dinjianwenan.top/chatgpt_231.html

OpenAI-o1 OpenAI o1 OpenAI01 chatgpt o1 o1-mini o1-preview OpenAI o1 mini OpenAI o1 preview OpenAI o1官网 OpenAI o1官网入口 OpenAI o1地址 OpenAI o1中文版 openai o1模型简介

OpenAI发布重磅新模型o1

背景

模型表现

o1模型揭秘

模型安全

o1模型的用户群体

OpenAI o1-mini

如何使用OpenAI o1

OpenAI下一步工作

总结

References

相关文章

当ChatGPT说中文，智能对话背后的「潜台词」与实战指南

微软ChatGPT，一场静悄悄的生产力革命

为什么你总找不到ChatGPT-4o官网？这些隐藏入口和行业真相必须了解

ChatGPT官网全英文？三个技巧助你无障碍使用

ChatGPT隐藏入口全解析，这8个场景你可能从未想到