GPT4.5官网

重磅发布:OpenAI o1系列模型

chatgpt2024-09-13 02:28:2857

‍OpenAI在北京时间9月13日的凌晨,更新了o1系列模型。主要包含o1-mini、o1-preview 。
        从今天开始,ChatGPTPlus和Team用户将能够访问ChatGPT中的o1模型。o1-preview和o1-mini都可以在模型选择器中手动选择,在发布时,o1-preview 的每周速率限制为30条消息,o1-mini的每周速率限制为50条。我们正在努力提高这些速率,并使ChatGPT能够针对给定的提示自动选择正确的模型
关于新模型的介绍:
我们开发了一系列新的人工智能模型,旨在让它们在做出反应之前花更多的时间思考。 它们可以通过复杂的任务进行推理,解决比以前的科学、编码和数学模型更难的问题。
OpenAI o1-preview 先行版
        这个先行版模型经过特别设计,能够在回应之前进行更深入的推理,因此它能够处理比之前AI更复杂的任务。不论是科学领域的难题,还是编程、数学等技术挑战,o1-preview都展现出了超越以往的解决能力。它的核心在于应对复杂问题时更具逻辑性和耐心。
OpenAI o1-mini:轻量级的强大AI
        如果你对数学和编程感兴趣,那么o1-mini无疑会成为你关注的焦点。它专注于STEM领域(科学、技术、工程、数学),尤其在数学和编程方面表现尤为出色。虽然比起完整版的o1-preview,o1-mini更加轻量级,但它在像AIME和Codeforces等专业评估基准上的表现几乎与o1持平。对于需要推理但不涉及广泛知识的应用,o1-mini是一款既快速又经济的AI选择。
数学:在高中 AIME 数学竞赛中,o1-mini(70.0%)与 o1(74.4%)相当,同时价格便宜得多,且成绩优于 o1-preview(44.6%)。o1-mini 的得分(约 11/15 个问题)大约位列美国高中生前 500 名。
编码:在 Codeforces 竞赛网站上,o1-mini 的 Elo 得分为 1650,与 o1(1673)不相上下,且高于 o1-preview(1258)。这一 Elo 得分使该模型在 Codeforces 平台上竞争的程序员中处于第 86 个百分位左右。o1-mini 在 HumanEval 编码基准和高中级网络安全夺旗挑战赛 (CTF) 中也表现出色。

从图中不难看出,代码和安全都有很大的提升。

OpenAI o1 系统安全报告
在推出这些AI模型之前,我们进行了大量的安全性研究。这份报告详细介绍了我们在发布OpenAI o1-preview和o1-mini之前所采取的安全措施,涵盖了外部红队测试(模拟攻击以评估系统安全性)以及前沿风险评估。这些工作确保了模型的安全性和稳定性,符合我们严格的“准备框架”。
API模型也已经同步更新
        可以看到o1-preview模型还是比较贵的,o1-mini模型相比与4o模型降低了40%。总的来说,o1系列的模型在数学和编码上更加出色,逻辑能力更强,api模型费用降低了。在模型安全性能上也提升了不少
如何体验新模型呢
        我们的站点已经同步更新了最新的模型,由于模型次数限制不多。需要体验的朋友们要抓紧时间。
关注我们,后台将会自动给您回复体验地址。
简单测试一下
在以往的答案中是9.11比较大。
由于时间关系,就不测试了。可以自行体验。关注我,带你掌握最新资讯。

本文链接:http://dinjianwenan.top/chatgpt_230.html

OpenAI-o1ChatGPTPlusOpenAI o1chatgpt 中文OpenAIo1OpenAI01chatgpt o1o1-minio1-preview‍‍OpenAI o1-miniOpenAI o1-preview

相关文章

网友评论