OpenAI现场演示翻车?GPT-5发布会现神图,奥尔特曼自嘲:图表重大失误
2025-08-08 06:48:23AI云资讯2198
(AI云资讯消息)在北京时间8月8日凌晨举行的GPT-5重磅直播发布会上,OpenAI展示的多组数据图表看似彰显了模型的卓越性能,但细看之下,部分图表却出现了令人啼笑皆非的乌龙。
最具讽刺意味的是一张展示各模型欺骗评估表现的图表:纵坐标刻度混乱不堪。例如在代码欺骗指标中,现场演示显示GPT-5思考版取得50.0%的欺骗率,但对比参照的OpenAI自家o3小模型47.4%的数值时,o3小模型柱状图反而显示更长。有趣的是,OpenAI在官方博客中公布的准确数据显示,GPT-5实际欺骗率应为16.5%。
在这张引发争议的图表中,OpenAI现场演示出现了一个明显悖论:GPT-5某项评分明明低于o3模型,对应的柱状图却显示更长。更离谱的是,o3与GPT-4o的评分数值不同,图表中却呈现为等长柱状。如此严重的可视化失误,连CEO萨姆·奥尔特曼都忍不住吐槽这是史诗级图表翻车,不过他随即澄清官网博客已发布正确版本。
目前,OpenAI尚未就此事置评。虽然尚不确定这些图表是否由GPT-5生成,但在新品发布的重要时刻出现如此纰漏,对公司形象着实不利,尤其当OpenAI正大力宣传其新模型在减少幻觉方面取得重大突破之际,这样的失误显得格外讽刺。
相关文章
- OpenAI宣布进入“红色警报”状态,谷歌在人工智能领域加速追赶
- Checkout.com 启用 OpenAI 智能体电商协议,赋能全球企业商户
- OpenAI在ChatGPT中推出群聊功能
- OpenAI正式发布GPT-5.1,ChatGPT可提供8种对话模式
- OpenAI在安卓平台推出Sora应用
- OpenAI与亚马逊达成380亿美元AI训练合作协议
- OpenAI完成营利性重组,并与微软达成了新协议
- OpenAI推出新款AI网页浏览器ChatGPT Atlas
- 日本要求OpenAI停止盗用漫画和动漫内容
- OpenAI与博通合作生产自研AI芯片,英伟达独占市场的局面将逐步打破
- OpenAI的Sora 5天下载量已突破100万次,增速超ChatGPT
- OpenAI推出新款社交视频应用:可对好友进行深度模仿
- 微软携手OpenAI的竞争对手Anthropic,共同提升Microsoft 365应用效能
- 英伟达与OpenAI达成合作,投资1000亿美元建10吉瓦AI数据中心
- 微软与OpenAI达成新协议,或为OpenAI上市铺平道路
- 甲骨文与OpenAI达成3000亿美元“星际之门”项目协议 或将重塑云计算与人工智能未来









