文丨Congerry
OpenAI 放出了一个迷雾弹。
当Google、Meta、Anthropic等公司都在猛推大模型的时候,OpenAI除了对GPT-4修修补补,似乎一直没有什么大的动静。
但是今天,一个名为"gpt2-chatbot"的神秘大模型凭空杀出,其能力似乎与 GPT-4 保持在同一水准,甚至在一些任务上的表现比 GPT-4 Turbo 还要好,让整个AI社区炸开了锅。
这不禁让人联想一直未曾露面的GPT-4.5或GPT-5。就连Sam Altman也发了一段让人摸不着头脑的话,自己对 gpt2 情有独钟。
这个"gpt2-chatbot"表现如何呢?
该模型第一次尝试就解决了国际数学奥林匹克竞赛(一项面向高中生的著名竞赛)中的一个问题。
人工智能研究员、斯坦福大学学生Andrew Gao说,要知道国际数学奥林匹克竞赛难得要命,只有美国数学成绩最好的四名学生才能参加比赛。
宾夕法尼亚大学沃顿商学院研究 AI 的教授 Ethan Mollick 表示,在他的实验中,该模型在复杂的推理任务(例如编写代码绘制独角兽图片)上表现优于 GPT-4。“也许比 GPT-4 更好,”他说。“很难说,但它在标志性的‘用代码画独角兽’任务上确实做得更好。”
该模型还表现出了编写具有挑战性的代码的能力。
CodeGen 的创始工程师 Chase McCoy 表示,gpt2-chatbot “在我们用来测试新模型的所有编码提示上都做得更好”,而不是 GPT-4 或 Claude Opus。“这种氛围肯定是存在的,”他说。
但也有不少人持谨慎怀疑态度,认为gpt2-chatbot的能力被过度夸大了。他们指出:
这个模型在经典的24点游戏、数学推导等老题types仍然采取的是暴力式枚举推理,而未展现出任何更先进的解题手段。
在绘画时,也不遵从指令。
在经典的"农夫过河"推理题上,gpt2-chatbot的5步解法也显得冗长。
那么,这个gpt2-chatbot到底是什么来头?
通过对它的一些细节分析,网友们给出了以下几种可能:
它就是OpenAI后继GPT-4的下一代大模型GPT-4.5,或者是传闻已久的GPT-5。
但是Andrew Gao认为,如果这就是GPT-4.5或者GPT-5的能力,那么意味着人类在AI上面碰壁了。言外之意,gpt2-chatbot“不配”。
也有网友认为它是在GPT-4的基础上,融合了开创性的"Q*"推理技术,而非全新架构。这可以解释它为什么在某些特定任务上能给出远超GPT-4的惊人表现。
还有网友认为它是由OpenAI 2019年发布的GPT-2模型经过了LMSYS等机构的特殊调教和改造所获得,其实质还是老架构。
另外,还有人猜想它其实就是由LMSYS这家从事AI技术研究的公司打造出来的全新模型,只是在整个AI界伪装成"来自OpenAI"罢了。
对于这个谜一样的问题,Sam Altman也是卖了个关子,在推特上表示"我确实很钟情gpt2。
除了gpt2-chatbot,OpenAI本身也在悄悄推出一些重磅新功能。
最新的消息是,OpenAI正在为ChatGPT Plus用户推出一项全新的"记忆"功能。简单来说,用户在与ChatGPT对话时,可以让它记住特定的信息细节,这些记忆会一直保留下去,并会在下一次对话时被调用和使用。
比如,如果你告诉ChatGPT你家里的小孩特别喜欢水母,那么下次让它帮忙设计生日贺卡时,它就会为你推荐使用水母图案。OpenAI称,未来ChatGPT甚至可能比你的家人更了解你了。
这个"人性化"的记忆功能,被认为是朝着AGI(人工通用智能)迈出的一小步。它让ChatGPT更贴近真实世界,个性化程度更高,对话体验也更加自然。多数网友对此新功能表示欢迎,不过也有人担心隐私问题。
OpenAI还透露,未来这个功能还会面向企业用户推出,并扩展到GPT语言模型的其他版本。
如果您想要获取最新的科技趋势分析、行业内部的独家见解、定期的互动讨论和知识分享、与行业专家的直接面对面交流的机会!
欢迎扫描下方二维码,加头部科技创始人、AI头号玩家俱乐部主理人张晶晶微信!
网友评论