OpenAI安全研究主管离职 跳槽至竞争对手Anthropic
2026-01-16 06:09:42AI云资讯1758

(AI云资讯消息)过去一年,人工智能行业颇具争议的问题是,当用户在与聊天机器人的对话中表现出心理健康问题的迹象时,该如何应对。负责此类安全研究的OpenAI高管安德烈亚·瓦隆内(Andrea Vallone)现已离职加入Anthropic公司。
近日,瓦隆内在社交平台领英发文中表示:"过去一年中,我领导着OpenAI针对一个几乎无先例可循问题的研究:当模型面对情感过度依赖迹象或心理健康困扰的早期征兆时,应如何回应?"
瓦隆内在OpenAI任职三年期间,组建了模型策略研究团队,专注于GPT-4、OpenAI推理模型及GPT-5的最佳部署方案,并为基于规则奖励机制等AI行业主流安全技术开发训练流程。如今她已加入Anthropic的对齐团队,该团队致力于研判人工智能模型的最大风险及应对策略。
瓦隆内将向杨·莱克(Jan Leike)汇报工作,而杨·莱克恰是前OpenAI安全研究负责人,于2024年5月离职。杨·莱克辞职原因是反对OpenAI管理层重视光鲜的产品开发胜于安全文化。
过去一年来,领先的人工智能初创企业因用户心理健康问题引发的争议日益加剧。当用户向AI聊天机器人倾诉时,心理困境可能进一步恶化,尤其在长时间对话中安全护栏往往失效。多个受害家庭已提起诉讼,安全研究人员正承担着解决这一严峻问题的责任。
对齐团队负责人萨姆·鲍曼(Sam Bowman)在领英发文中表示,他“为Anthropic严肃地对待如何规范AI系统行为这一难题感到自豪。”
1月15日,瓦隆内在领英发文中表示:"我渴望在Anthropic继续我的研究,专注于通过对齐与微调技术,塑造Claude在新情境下的行为模式。"
相关文章
- OpenAI宣布获得亚马逊、英伟达和软银新融资1100亿美元
- OpenAI首次采用Cerebras的AI芯片运行Codex模型,成功实现了每秒1000次事务处理量
- OpenAI开始向ChatGPT的低成本用户推送广告
- OpenAI推出企业级AI智能体平台Frontier
- 苹果为旗下编程工具接入Anthropic和OpenAI智能体功能
- 英伟达与OpenAI的千亿美元超级合作陷入停滞
- OpenAI试水ChatGPT广告业务,每千次曝光量收费60美元
- OpenAI宣布首款消费级AI设备预计2026年下半年上市
- OpenAI数据中心将自行承担能源成本并限制用水量
- OpenAI首席财务官表示2026年的工作重心是实际应用
- OpenAI将推出搭载三星2纳米Exynos芯片的无线耳机,自研Titan专用芯片预计年底问世
- OpenAI安全研究主管离职 跳槽至竞争对手Anthropic
- OpenAI狂揽软银2800亿融资,谷歌/微美全息领衔AI军备竞赛重塑大模型格局
- OpenAI推出ChatGPT Health,鼓励用户关联个人医疗记录
- OpenAI在进行测试ChatGPT广告,暂时不会在聊天中出现
- OpenAI推出全新旗舰级图像生成模型GPT Image 1.5
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench
- 在MoltBot/ClawdBot,火山方舟模型服务助力开发者畅享模型自由
- 教程 | OpenCode调用基石智算大模型,AI 编程效率翻倍
- 全国首个!上海上线规划资源AI大模型,商汤大装置让城市治理“更聪明”
- 昇思人工智能框架峰会 | 昇思MindSpore MoE模型性能优化方案,提升训练性能15%+









