刚刚,一个强大的新AI大模型神秘地出现在互联网上,引发了关于其起源和能力的疯狂猜测游戏,一些研究人员认为它代表了对现有人工智能模型的重大飞跃。
该模型被称为“gpt2-chatbot”,在一个比较人工智能语言系统的流行网站上无声无息地出现(由Gradio构建的LMSYS Chatbot Arena)。
4小时前,奥特曼亲自发文“我确实对gpt2情有独钟”
再次把大家的胃口吊起来,不得不说,这种话说一半的“方式”真的是顶尖营销高手!
斯坦福AI研究人员(@itsandrewgao)指出,该模型首次尝试就解决了国际数学奥林匹克竞赛的一个问题,这是一个为高中生举办的有声望的比赛。“IMO非常难,”Gao说。“只有美国最好的四名数学学生才能参加比赛。”
他的核心观点:
性能水平:初步认为“gpt2-chatbot”的性能大约与GPT-4相当,但是否超越GPT-4仍有待进一步验证。
代理能力:“gpt2-chatbot”在规划和执行任务方面表现出色,能够提供潜在的网站和搜索查询建议,这在某种程度上比GPT-4更为明确和有用。
模型来源:尽管“gpt2-chatbot”声称由OpenAI制造,但由于数据污染问题,这一声明并不可靠。许多模型都在OpenAI的聊天数据上进行训练,因此可能会错误地认为自己由OpenAI开发。
技术细节:有报告称“gpt2-chatbot”在处理某些特殊标记时显示出与其他OpenAI模型相似的弱点,并且似乎使用了OpenAI家族的标记器进行训练。
微调可能性:即使“gpt2-chatbot”展现出了某些改进,这也可能通过微调GPT-4模型来实现,而不一定意味着它是一个全新的模型。
不确定性:目前还无法确定“gpt2-chatbot”的确切制造者,但普遍认为至少达到了GPT-4的水平。
宾夕法尼亚大学沃顿商学院研究人工智能的教授Ethan Mollick表示,在他的实验中,该模型在复杂推理任务上的表现超过了GPT-4,比如编写代码绘制独角兽的图片。“也许比GPT-4更好,”他说。“很难说,但它在标志性的‘用代码画独角兽’任务上做得更好。”
关于神秘模型起源的猜测满天飞
该模型的出色表现引发了关于谁可能创造了它以及为什么它通过一个测试网站在没有宣传的情况下发布而引起了广泛的猜测。
许多研究人员认为“gpt2-chatbot”很可能起源于OpenAI,尽管“gpt2-chatbot”在能力上接近GPT-4,但它没有达到许多人对OpenAI传闻中的下一个大模型GPT-5的预期。“我查看了几乎所有模型发布的商业创意提示,响应看起来更倾向于倾向于代理行动,”人工智能研究员Joe Fox在X.com上的一篇帖子中说,暗示“gpt2-chatbot”在一些实际测试上并没有比GPT-4有巨大的飞跃。
“gpt2-chatbot”可能来自一个不太知名的公司或研究小组,它们希望展示其人工智能能力并制造轰动效应的可能性仍然存在。一些人指出了GPT-4chan的例子,这是一个由人工智能研究员Yannic Kilcher在2022年6月发布的有争议的人工智能模型,它也使用了流行的GPT命名约定,但与OpenAI无关(最终因“生成有害内容”而被从Hugging Face平台移除)。
意外的能力的暗示着进一步的潜力
随着专家们继续探索“gpt2-chatbot”以揭示其能力的极限,一些人已经发现了一些行为,这些行为暗示着进一步的潜在进步。
研究人员惊讶地发现,与之前的ChatGPT等聊天机器人相比,该模型似乎更愿意打破规则并忽略限制。威斯康星大学人工智能教授Dimitris Papailiopoulos表示,该模型能够解决GPT-4历史上失败的逻辑谜题。“我发现了一个任务,gpt2-chatbot比其他所有模型都好,而且它完全没用,”他开玩笑说。
该模型还展示了编写具有挑战性的代码的能力。CodeGen的创始工程师Chase McCoy表示,gpt2-chatbot在“我们用来测试新模型的所有编码提示”上的表现都比GPT-4或Claude Opus好。“气氛绝对在那里,”他说。
一些用户甚至发现,该模型可以进行来回对话,以迭代改进其响应,展示了对其自身局限性和思维过程的认识。“它似乎比GPT-4更擅长规划需要做什么,”Gao说。“例如,它提出了可能要查看的潜在网站和潜在的搜索查询。GPT-4给出了一个更模糊的答案。”
无论其真正的起源和全部潜力如何,“gpt2-chatbot”的出现突显了人工智能领域的发展速度有多快,以及跟上最新的突破有多困难。
就在一年多前,GPT-4在人工智能能够进行的“常识推理”方面标志着一个重大飞跃。紧随其后发布的Anthropic的ChatGPT竞争对手Claude 3,也在聊天机器人进行开放式对话的能力方面推动了界限。科技巨头如谷歌、Meta和苹果都宣布了在人工智能开发方面的主要投资。
与此同时,开放源代码人工智能模型的发布以及为特定任务微调现有模型的做法,使得即使是小团队和个人也可以在几乎没有警告的情况下在线创建和发布强大的人工智能。一个名为“gpt2-chatbot”的神秘新人工智能模型以其先进的能力震惊了研究人员,引发了对其起源和作为下一代人工智能突破的潜力的激烈猜测。
结果是,新系统的不断涌现扩展了对计算机能做什么的概念,偶尔,就像“gpt2-chatbot”的情况一样,给人工智能界带来了惊喜。观察意外的新系统已经成为研究人员追踪人工智能尖端的一种消遣。
参考:
https://venturebeat.com/ai/mysterious-gpt2-chatbot-ai-model-baffles-experts-a-breakthrough-or-mere-hype/熊嘻嘻
你觉得OpenAI下一个产品是GPT-4.5还是AI搜索引擎呢?
本文链接:https://dinjianwenan.top/chatgpt_211.html
ChatGPT4.5GPT4.5入口GPT4.5网页版GPT4.5发布GPT4.5网址GPT4.5官网GPT4.5GPTs分润功能sora测试版256k上下文