中科院院士张钹:发展第三代人工智能,需要产学研共同努力
2023-12-23 18:33:21AI云资讯1124
在12月23日举办的2023华为云AI院长峰会上,中国科学院院士、清华大学人工智能研究院名誉院长张钹发表视频致辞,对大模型的价值、面临的治理问题以及未来的发展方向进行了分享。

中国科学院院士、清华大学人工智能研究院名誉院长张钹发表视频致辞
大模型向通用AI迈出一步
大语言模型能够通过学习和理解人类的语言来进行对话,还能根据聊天的上下文进行互动,真正像人类一样来聊天交流,甚至能完成撰写新闻、邮件、视频脚本、文案、翻译、代码等任务。对此,张钹院士表示,与真人对话很接近,达到行为主义所追求的目标,这是AI里程碑式的成就。
张钹认为,相较第一代AI的知识驱动模型、第二代AI的数据驱动模型,突破特定的领域、利用特定的模型、实现特定的任务三个特定,向通用AI(AGI)迈出了一步。
对AI的治理需要从模型和使用角度出发
大模型的出现,使传统人工智能向生成式人工智能转变,为所有人工智能企业打开一扇新的大门,也将为AI产业发展带来新的机遇。
第一,促进AI科技革命。张钹解释,信息科学技术发展速度快是因为其在发展初期就打下了坚实的理论基础,但AI至今没有理论,AI已有的模型和算法都是针对具体领域和具体任务,难以建立通用的理论。但与第一代和第二代AI不同,大模型突破了三个特定,使可解释和鲁棒的AI理论成为可能,将会极大地推动AI科技的迅速发展。
第二,推动AI产业变革。受单领域和单任务的限制,AI的应用和产业化总是被限制于狭小的领域。但目前大模型已经从生成文本扩大到生成其他模态,可以使用通用的模型生成多样性的人类水平的图像、声音、视频和代码等。大模型通过微调可以满足不同领域和任务的需求,与知识库和其他工具结合,可以极大地扩大AI产业与应用的发展空间,有可能使AI产业进入新的发展阶段。
此外,大模型的发展也带来了一些挑战。第一,大模型目前仅在自然语言处理和编程等少数任务上做到了通用性,在诸如决策、博弈等领域能否实现通用性仍有待研究。
第二,大模型利用预测下一个词的自监督学习方法学习文本和生产文本,与人类的文本学习和语言生产的原理完全不同。这使得其具有三个本质性的缺陷,一是输出质量不一致,且不可控,存在犯大错误的可能性;二是受提示词(输入词)影响很大,输出鲁棒性比较差;三是没有自知之明,难以自我发现错误和纠正错误。
基于其缺陷,大模型生成不符合道德伦理、政治标准的内容比较常见,需要通过AI对齐来解决,这属于对模型的治理问题。同时大模型输出的正确内容也可能被误用和滥用,因此需要对使用者进行治理。在AI发展过程中,必须处理好发展和治理之间的关系,以保证AI的健康发展。
发展第三代人工智能需要产学研共同努力
尽管眼下GPT只能以人机对话的形式呈现,存在种种局限,但也向通用型人工智能的方向迈了一步。如何使AI走向通用的道路?张钹指出,“必须发展第三代人工智能。”
张钹认为,发展第三代人工智能的任务包括,第一,建立可解释和鲁棒的 AI 理论。第二,发展安全可信、可控、可靠和可扩展的AI技术。第三,推动AI的创新应用和产业发展。
要实现这个任务,张钹表示,需要把知识、数据、算法和算力充分利用起来,通过文本语义向量表示、多头注意机制的转换器、自监督学习这三个关键技术,实现了从过去只是把文本当成数据来处理,转变为对文本的内容及文本所包含知识的处理,这是关键性的一步。
张钹指出,发展第三代人工智能,还需要产学研共同努力,把基础研究、技术创新和产业化三者结合起来。
相关文章
- 全国人工智能发展大会 AI HANGZHOU 2026中国(杭州)国际人工智能展览会
- 亿达科创亮相国际人工智能展再获AI大奖
- 欢聚旗下百果园网络入选2025广州人工智能创新发展榜单
- 自主可控 智测未来|科大讯飞人工智能终端测试中心正式揭牌
- 北京国际人力获评世界品牌莫干山大会“人工智能+”生态创新实践范本
- 第九届数字中国建设峰会分论坛“人工智能产业发展和赋能新型工业化”主题交流活动在福州圆满落幕
- IBM咨询扩展人工智能能力,加速企业转型
- 点猫科技与新加坡华侨中学签署人工智能教育合作备忘录
- 许欢:人工智能应急大模型开启应急管理新发展时代
- 人工智能终端迎来“国家标尺” 联想以规模化产品实践助力标准编制
- SpaceX拟在得克萨斯州建设人工智能芯片工厂,总耗资达1190亿美元
- 微软放弃Xbox Copilot人工智能
- 人工智能助力新型工业化 第九届数字中国建设峰会工业智能产业生态大会成功举办
- 中兴通讯携手印尼XLSMART 在雅加达正式启动联合创新中心加速印尼 5G-Advanced 与人工智能发展与应用
- 马斯克出庭作证,诉讼指控OpenAI违背了打造惠及全人类的通用人工智能的核心使命
- 实力登榜!思特奇入选2026全国企业“人工智能+”行动创新案例TOP100
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源









