OpenAI现场演示翻车?GPT-5发布会现神图,奥尔特曼自嘲:图表重大失误
2025-08-08 06:48:23AI云资讯1935
(AI云资讯消息)在北京时间8月8日凌晨举行的GPT-5重磅直播发布会上,OpenAI展示的多组数据图表看似彰显了模型的卓越性能,但细看之下,部分图表却出现了令人啼笑皆非的乌龙。
最具讽刺意味的是一张展示各模型欺骗评估表现的图表:纵坐标刻度混乱不堪。例如在代码欺骗指标中,现场演示显示GPT-5思考版取得50.0%的欺骗率,但对比参照的OpenAI自家o3小模型47.4%的数值时,o3小模型柱状图反而显示更长。有趣的是,OpenAI在官方博客中公布的准确数据显示,GPT-5实际欺骗率应为16.5%。
在这张引发争议的图表中,OpenAI现场演示出现了一个明显悖论:GPT-5某项评分明明低于o3模型,对应的柱状图却显示更长。更离谱的是,o3与GPT-4o的评分数值不同,图表中却呈现为等长柱状。如此严重的可视化失误,连CEO萨姆·奥尔特曼都忍不住吐槽这是史诗级图表翻车,不过他随即澄清官网博客已发布正确版本。
目前,OpenAI尚未就此事置评。虽然尚不确定这些图表是否由GPT-5生成,但在新品发布的重要时刻出现如此纰漏,对公司形象着实不利,尤其当OpenAI正大力宣传其新模型在减少幻觉方面取得重大突破之际,这样的失误显得格外讽刺。
相关文章
- 微软与OpenAI达成新协议,或为OpenAI上市铺平道路
- 甲骨文与OpenAI达成3000亿美元“星际之门”项目协议 或将重塑云计算与人工智能未来
- OpenAI携AI动画电影《Critterz》进军好莱坞
- 声网兄弟公司 Agora与OpenAI 携手 助力多模态 AI 智能体实现实时交互
- OpenAI或于2026年推出自研AI芯片
- 马斯克起诉OpenAI和苹果公司,指控ChatGPT和苹果应用商店非法垄断
- OpenAI对盈利模式持开放态度 ChatGPT负责人称不排除未来加入广告
- OpenAI奥尔特曼支持脑机接口公司MergeLabs,致力于实现人机智能融合
- OpenAI现场演示翻车?GPT-5发布会现神图,奥尔特曼自嘲:图表重大失误
- OpenAI推出GPT-5,奥尔特曼盛赞为写作、编程及人类级推理的最佳模型
- OpenAI发布开放权重人工智能模型:采用Apache 2.0开源协议,支持本地运行
- 生鲜电商Instacart首席执行官将于8月18日正式开始执掌OpenAI核心业务
- 耗资5000亿美元的星际之门项目因OpenAI与软银内部分歧而陷入僵局
- 领先OpenAI三个月,百度文库GenFlow支持自主调用数百Agent、多模内容并行生成,2.0版本8月上线
- OpenAI推出新款ChatGPT智能体可以操控整台电脑并完成任务
- 被Meta高薪挖角后,OpenAI拟重审薪酬体系