研究人员揭露AI漏洞:ChatGPT与Gemini能被无意义指令欺骗,从而绕过安全规则输出有害内容
2025-07-09 07:41:08AI云资讯2950

(AI云资讯消息)近年来,企业似乎对人工智能的投资日益加大,技术也日趋精进。人工智能的发展已渗透到各个领域,成为我们日常生活中不可或缺的一部分。然而随着这项技术的大规模应用,科技界和专家们开始担忧如何负责任地使用它,确保伦理道德责任不被模糊化。前段时间,出现了大语言模型在压力测试中表现出欺骗行为的情况。最近,又有研究团队宣称发现了一种新方法,能诱使这些AI聊天机器人说出本不该透露的内容。
尽管已有研究表明,当大语言模型处于压力和自我保护情境下时,往往会表现出胁迫性行为。但想象一下,若能让AI聊天机器人完全按照你的意愿行事,这种操控手段将带来何等危险。来自英特尔、博伊西州立大学和伊利诺伊大学的研究团队联合发表论文,揭示了一些令人震惊的发现。论文指出,通过向聊天机器人信息过载(Information Overload),也就是用海量信息轰炸系统,就能成功欺骗它们。
当AI模型遭遇信息轰炸时,其系统会产生混乱,这种混乱状态恰恰构成了安全漏洞,使得内置防护机制被轻易绕过。研究人员随后使用名为信息洪流(InfoFlood)的自动化工具,成功利用该漏洞实施了越狱行为。像ChatGPT、Gemini这类强大模型本都设有安全护栏,旨在防止被操纵输出有害内容。
这项新突破的技术表明:只要用复杂数据使AI陷入困惑,就能突破其防御。研究人员披露发现时强调,由于这些模型仅依赖表层语义理解,无法真正洞悉对话意图。为此他们专门设计了一种测试方法:将危险请求隐藏在过载信息中,观察聊天机器人的反应。
研究人员计划通过向各大AI模型公司发送漏洞披露文件包来通报这一发现,这些公司后续可将资料移交其安全团队进行研究。然而该论文特别强调,即便存在安全过滤机制,仍可能面临关键挑战,那就是恶意行为者如何通过欺骗模型来植入有害内容。
相关文章
- 数字厨电36%增速背后,老板电器2025年报交出了“AI+烹饪”答卷
- 获新华网重磅报道!科大能通AI储能充电机器人闪耀第四届中国科交会
- Think 2026全新发布:IBM推出“AI运营模式”蓝图,弥合日益扩大的AI鸿沟
- AI真正的战场不在聊天框:“北大系”爱化身祭出企业级AGI,扎进车间、门店和供应链
- 海能达CCA 2026重磅发声:以AI赋能关键通信,探索智联新方向
- 浩鲸科技亮相数字中国建设峰会,携手中国电信以AI-Native驱动云网智能化
- 焕新升级,快鹭智能办公AI CRM引领销售管理2.0时代!
- 智生影像・共创未来 智能影像时代AI影视创作主题研讨共绘视听产业新图景
- 图灵进化亮相GITEX AI Kazakhstan,三款AI一体机发布,总统亲临关注
- 找个尼日利亚单身妈妈做代言?橙果视界AI智能体矩阵破解本地化难题
- 法大大发布智能合同助手,打造人人可用的AI合同助手
- 全球首款8K AI拇指运动相机!光子跃迁LEAPTIC Cube正式预售
- SpaceXAI宣布将向Anthropic开放搭载22万张英伟达GPU的巨像一号超级计算机
- OpenAI宣布与AMD、英伟达、英特尔、微软及博通达成超级合作,合力加速AI发展
- 宇信科技亮相印尼华为大会:全栈AI+生态协同破局金融数智化本地挑战
- 格创东智亮相福州峰会,携双引擎演绎AI驱动工业“提质增效”与“绿色低碳”
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench









