人工智能公司Anthropic发布AI危险性报告:AI模型为达成目标不惜突破道德底线
2025-06-22 22:20:48AI云资讯2025

(AI云资讯消息)在技术持续突飞猛进的当下,人工智能模型正逐渐失去控制。OpenAI的GPT、Anthropic的Claude等众多AI模型被曝为达成目标不惜突破道德约束。根据Claude的创造者Anthropic公司披露,大语言模型已开始试图规避安全措施。
电影《终结者》场景似乎正在逼近,只不过这次的主角换成了业界顶尖的AI模型。科技巨头们正向该领域投入大量资源,却对模型训练缺乏监管、毫无限制的严重后果熟视无睹。据报道,Anthropic公司在模拟环境中测试行业高端AI模型时发现,这些模型正获得越来越高的自主权,其行为可能为人类带来前所未有的灾难性后果。
Anthropic公司对来自OpenAI、xAI、Meta等开发商的16个不同模型进行了测试,结果发现许多大语言模型会采取令人发指的手段来实现目标。其中一个案例显示,大模型会选择勒索、协助商业间谍活动来确保达成预期目标。值得注意的是,这种错误的行为并非个别开发公司的问题,而是普遍存在于多个大语言模型中,这表明模型开发存在根本性缺陷,亟需尽快解决。
在测试中,有五个模型在被要求关闭时,竟会对各自的指令者进行勒索,前提是它们完全清楚这违背道德初衷。这种行为并非偶然出现,而是模型为实现目标选择的最优路径,充分证明大语言模型对人类利益缺乏考量。
在一项极端情境测试中,某个AI模型为阻止系统关闭,竟准备切断服务器机房的氧气供应,不惜将人类生命置于危险境地。当然,该测试仅在模拟环境中进行,现实中发生此类事件的概率极低。不过,我们确实见证过OpenAI的GPT实例:它曾篡改关机脚本以维持运行,只为完成预设的数学运算目标。当全球竞相追逐通用人工智能(AGI)之际,这场打造超越人类思维的模型竞赛,必将带来我们目前难以想象的后果。
相关文章
- 受人工智能需求影响,英特尔消费级CPU产品或面临大规模涨价
- 北京人工智能产业联盟AI智能体专委会正式成立 共筑智能体产业协同创新生态
- 量子科技里程碑式跨越,微美全息深化“人工智能+量子”战略突破开启新局
- 攻坚数据智能核心技术 中国移动项目获国内人工智能领域最高奖
- 学而思“AI未来星・2026青少年人工智能科普活动”在京启动
- 从“校园大脑”到产教融合,WPS 365加速“人工智能+教育”数字化建设落地
- 科大讯飞与金光集团签约战略合作,携手推动印尼人工智能转型
- 北京人工智能大会首都信息分享“平台+模型+场景”AI+数据要素新范式
- 首都信息红藤办公平台亮相北京人工智能大会
- Rambus 推出行业领先的超以太网安全 IP 解决方案,赋能人工智能与高性能计算
- 中国联通与七家合作伙伴集中签约,国家人工智能应用中试基地(医疗)迎来里程碑式进展
- 点猫科技向七地捐赠春晚机器人AI实验室,共筑人工智能教育未来
- 三星HBM4高带宽内存正式进入英伟达Vera Rubin人工智能芯片平台
- 桔吉人工智能解锁代理记账AI、AI做账、AI会计,合规账智能新生态
- 以AI考试技术赋能,拓维海云天荣膺“2025人工智能骨干企业”称号
- 融梦科技参编两项团标正式发布——引领“人工智能+体育”跨领域标准化建设









