OpenAI现场演示翻车?GPT-5发布会现神图,奥尔特曼自嘲:图表重大失误
2025-08-08 06:48:23AI云资讯2275

(AI云资讯消息)在北京时间8月8日凌晨举行的GPT-5重磅直播发布会上,OpenAI展示的多组数据图表看似彰显了模型的卓越性能,但细看之下,部分图表却出现了令人啼笑皆非的乌龙。
最具讽刺意味的是一张展示各模型欺骗评估表现的图表:纵坐标刻度混乱不堪。例如在代码欺骗指标中,现场演示显示GPT-5思考版取得50.0%的欺骗率,但对比参照的OpenAI自家o3小模型47.4%的数值时,o3小模型柱状图反而显示更长。有趣的是,OpenAI在官方博客中公布的准确数据显示,GPT-5实际欺骗率应为16.5%。
在这张引发争议的图表中,OpenAI现场演示出现了一个明显悖论:GPT-5某项评分明明低于o3模型,对应的柱状图却显示更长。更离谱的是,o3与GPT-4o的评分数值不同,图表中却呈现为等长柱状。如此严重的可视化失误,连CEO萨姆·奥尔特曼都忍不住吐槽这是史诗级图表翻车,不过他随即澄清官网博客已发布正确版本。
目前,OpenAI尚未就此事置评。虽然尚不确定这些图表是否由GPT-5生成,但在新品发布的重要时刻出现如此纰漏,对公司形象着实不利,尤其当OpenAI正大力宣传其新模型在减少幻觉方面取得重大突破之际,这样的失误显得格外讽刺。
相关文章
- OpenAI开始向ChatGPT的低成本用户推送广告
- OpenAI推出企业级AI智能体平台Frontier
- 苹果为旗下编程工具接入Anthropic和OpenAI智能体功能
- 英伟达与OpenAI的千亿美元超级合作陷入停滞
- OpenAI试水ChatGPT广告业务,每千次曝光量收费60美元
- OpenAI宣布首款消费级AI设备预计2026年下半年上市
- OpenAI数据中心将自行承担能源成本并限制用水量
- OpenAI首席财务官表示2026年的工作重心是实际应用
- OpenAI将推出搭载三星2纳米Exynos芯片的无线耳机,自研Titan专用芯片预计年底问世
- OpenAI安全研究主管离职 跳槽至竞争对手Anthropic
- OpenAI狂揽软银2800亿融资,谷歌/微美全息领衔AI军备竞赛重塑大模型格局
- OpenAI推出ChatGPT Health,鼓励用户关联个人医疗记录
- OpenAI在进行测试ChatGPT广告,暂时不会在聊天中出现
- OpenAI推出全新旗舰级图像生成模型GPT Image 1.5
- 英伟达在AI图形处理器上部署训练OpenAI的GPT-5.2,为人工智能产业提速
- 算力帝国的双重博弈:解码OpenAI在英伟达与AMD之间的16GW战略布局









