陈天桥雒芊芊脑科学研究院OMNE人工智能长期记忆框架荣登GAIA排行榜榜首
2024-10-31 12:40:03AI云资讯9580
陈天桥雒芊芊脑科学研究院(TCCI)内部人工智能团队凭借对大脑和记忆的深刻理解,在人工智能领域取得了重大突破。他们自主研发的OMNE多智能体框架在GAIA(通用人工智能助手)基准测试排行榜(https://huggingface.co/spaces/gaia-benchmark/leaderboard)上夺得首位,该排行榜由Meta AI、Hugging Face和Hugging Face的AutoGPT共同发起。 OMNE的表现优于包括微软研究院(Microsoft Research)在内的一些世界领先机构的框架。 这一成就基于TCCI多年的大脑研究成果,赋予智能体长期记忆(LTM)能力,使得框架能够进行更深层次、更缓慢的思考,并在复杂问题解决中增强大型语言模型(LLM)的决策能力。

Tianqiao_and_Chrissy_Chen_Institute__Institute_was_created_in_2016_by_Tianqiao_Chen_and_Chrissy_Luo
这一里程碑是自该研究院创始人、前中国科技巨头陈天桥去年宣布"All-In AI战略"以来,TCCI人工智能团队的一项重大成就。
OMNE目前的总体成功率达到40.53%,在性能上超过了Meta、微软、Hugging Face、普林斯顿大学、香港大学、英国人工智能安全研究所以及百川等提交的成果。与此相比,配备插件的GPT-4的成功率仅为15%。
GAIA是多智能体智能领域中最严格的数据集之一,能够在其排行榜上位居首位,彰显了TCCI在人工智能领域的深厚专业知识以及拓展创新边界的能力。
OMNE是一个基于长期记忆(LTM)的多智能体协作框架。 每个智能体具有相同且独立的系统结构,能够自主学习和理解完整的世界模型,从而独立理解其环境。 基于LTM的多智能体协同系统使人工智能系统能够实时适应个体行为变化,优化任务规划和执行,促进个性化、高效的自我进化。
这一突破是长期记忆机制的融合,大大缩小了MCTS的搜索空间,提高了对复杂问题的决策能力。通过引入更高效的逻辑推理,OMNE不仅提升了单个智能体的智能水平,还通过优化协作机制显著增强了多智能体系统的整体能力。这种增强的灵感来自对人类大脑皮层柱状结构的研究。作为大脑认知和行为功能的基本单位,皮质柱通过复杂的协作机制实现信息处理。通过加强单个智能体之间的协作,人工智能模型可能逐渐展现出认知能力,构建起内部表征模型,并最终推动系统整体智能的飞跃。
"我们对OMNE荣登GAIA排行榜榜首感到无比自豪。" TCCI人工智能团队负责人表示。 "这一成就展示了利用长期记忆推动人工智能自我进化和解决现实世界问题的巨大潜力。 我们认为,推进长期记忆和人工智能自我进化的研究对于人工智能技术的持续发展和实际应用至关重要。"
相关文章
- 全国人工智能发展大会 AI HANGZHOU 2026中国(杭州)国际人工智能展览会
- 亿达科创亮相国际人工智能展再获AI大奖
- 欢聚旗下百果园网络入选2025广州人工智能创新发展榜单
- 自主可控 智测未来|科大讯飞人工智能终端测试中心正式揭牌
- 北京国际人力获评世界品牌莫干山大会“人工智能+”生态创新实践范本
- 第九届数字中国建设峰会分论坛“人工智能产业发展和赋能新型工业化”主题交流活动在福州圆满落幕
- IBM咨询扩展人工智能能力,加速企业转型
- 点猫科技与新加坡华侨中学签署人工智能教育合作备忘录
- 许欢:人工智能应急大模型开启应急管理新发展时代
- 人工智能终端迎来“国家标尺” 联想以规模化产品实践助力标准编制
- SpaceX拟在得克萨斯州建设人工智能芯片工厂,总耗资达1190亿美元
- 微软放弃Xbox Copilot人工智能
- 人工智能助力新型工业化 第九届数字中国建设峰会工业智能产业生态大会成功举办
- 中兴通讯携手印尼XLSMART 在雅加达正式启动联合创新中心加速印尼 5G-Advanced 与人工智能发展与应用
- 马斯克出庭作证,诉讼指控OpenAI违背了打造惠及全人类的通用人工智能的核心使命
- 实力登榜!思特奇入选2026全国企业“人工智能+”行动创新案例TOP100
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源









