人工智能公司Anthropic发布AI危险性报告:AI模型为达成目标不惜突破道德底线
2025-06-22 22:20:48AI云资讯2347

(AI云资讯消息)在技术持续突飞猛进的当下,人工智能模型正逐渐失去控制。OpenAI的GPT、Anthropic的Claude等众多AI模型被曝为达成目标不惜突破道德约束。根据Claude的创造者Anthropic公司披露,大语言模型已开始试图规避安全措施。
电影《终结者》场景似乎正在逼近,只不过这次的主角换成了业界顶尖的AI模型。科技巨头们正向该领域投入大量资源,却对模型训练缺乏监管、毫无限制的严重后果熟视无睹。据报道,Anthropic公司在模拟环境中测试行业高端AI模型时发现,这些模型正获得越来越高的自主权,其行为可能为人类带来前所未有的灾难性后果。
Anthropic公司对来自OpenAI、xAI、Meta等开发商的16个不同模型进行了测试,结果发现许多大语言模型会采取令人发指的手段来实现目标。其中一个案例显示,大模型会选择勒索、协助商业间谍活动来确保达成预期目标。值得注意的是,这种错误的行为并非个别开发公司的问题,而是普遍存在于多个大语言模型中,这表明模型开发存在根本性缺陷,亟需尽快解决。
在测试中,有五个模型在被要求关闭时,竟会对各自的指令者进行勒索,前提是它们完全清楚这违背道德初衷。这种行为并非偶然出现,而是模型为实现目标选择的最优路径,充分证明大语言模型对人类利益缺乏考量。
在一项极端情境测试中,某个AI模型为阻止系统关闭,竟准备切断服务器机房的氧气供应,不惜将人类生命置于危险境地。当然,该测试仅在模拟环境中进行,现实中发生此类事件的概率极低。不过,我们确实见证过OpenAI的GPT实例:它曾篡改关机脚本以维持运行,只为完成预设的数学运算目标。当全球竞相追逐通用人工智能(AGI)之际,这场打造超越人类思维的模型竞赛,必将带来我们目前难以想象的后果。
相关文章
- 谷歌投资A24,共同开发人工智能电影制作工具
- 云从科技参与共建广州市粤港澳大湾区人工智能应用赋能中心
- 中电信人工智能公司跻身IDC报告中国智能体开发平台私有化市场份额前五
- 上海智位机器人正式加入鸿蒙生态,Mind+适配鸿蒙PC共推人工智能教育普及
- 解码AI未来 2026世界制造业大会人工智能与机器人展9月启幕
- 量化派李岩受邀参与中国信息通信研究院、人工智能百人会组织的“模数共振”闭门交流会
- 电科金仓携手四川省人民医院、海光信息、新华三、曙光云共建医疗人工智能应用创新中心
- 墨芯人工智能完成C轮近十亿元融资,下一代芯片SparsePrime®年内推出
- 数智贵州 智汇黔行|华为中国行2026·贵州人工智能创新峰会成功举办
- 中国—东盟人工智能产业创新中心成立
- 优步总裁称人工智能支出越来越难以证明其合理性
- 国家艺术基金《人工智能时代数字音乐产业人才培养》项目圆满收官
- 让AI进入真实法律交付环节——星云衡律携Nebulaw亮相2026全球人工智能终端展
- FONE正式加入中国人工智能产业发展联盟,引领业财AI智能体应用新范式
- 酷赛智能入选2026福布斯中国人工智能全球化标杆企业榜单
- 丈八科技与浪潮海若达成战略合作:共建人工智能产测一体化超级工厂
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 自变量机器人王昊:训练世界模型需付出“时间税”,解决模态对齐是当务之急
- 腾讯发布CodeBuddy Security,用AI Agent实现更高效的代码审计
- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代









