SOTA达成!腾讯优图D-Search算法登顶国际AI权威榜单

2025-11-07 18:07:10AI云资讯2030

腾讯优图实验室自研的AI搜索算法D-Search(Discourse),在「AI搜索智能体」领域的国际权威榜单Mind2Web2上,拿下了全球第一

Mind2Web2由美国俄亥俄州立大学与亚马逊联合发布,主要考察AI在真实网络环境中完成复杂任务的能力,已被NeurIPS 2025顶会收录,是全球AI圈公认的「最难考场」之一。

难度究竟有多大?

•任务复杂:它要求AI在真实的网站上连续浏览、提取信息,再整合、验证。平均每个任务得访问100多个网页,最长的要看375个网页才能答完;

•时效性强:对回答的时效性要求极强,例如问题是「本周NBA常规赛的得分王是谁?」,AI就必须自己去扒官网并实时更新;

•评分极严:评分不是简单地判断「对或错」,而是通过一棵最多达600节点的评分树逐层审查——包括是否标注信息来源、逻辑是否完整、有没有自检等。

评测严苛也就罢了,对手还包括OpenAI、Google、xAI、Anthropic等全球顶尖高手。

这场「神仙打架」,腾讯优图D-Search能够脱颖而出,关键在于让AI模仿人类解决问题的思路——

具体来说,我们引入修辞层次结构建模技术(Rhetorical Structure Theory, RST),让AI「先构思,再作答」,分成三步:

•第一步,看懂每份材料(构建网页内修辞树)。面对一大段网页,D-Search 会先「划重点」,识别出核心论点和辅助论据(比如因果关系、对比关系),而不是囫囵吞枣;

•第二步,串联所有材料(构建跨网页修辞图)。D-Search会把从不同网站、不同时间找来的信息片段,用逻辑关系(比如相互支持、还是相互矛盾)串起来,织成一张「信息网」;

•第三步,列大纲,下笔撰写(规划生成蓝图)。动笔生成答案前,D-Search会根据前两步的分析,制定一个详细的「写作规划」,明确先说啥、后说啥、证据怎么放,保证报告严谨清晰。

总的来说,这套「深度搜索」能力,在工作和生活中都非常有用——

在工作上,它能帮你快速扒财报、盯专利、总结内部知识库 ,成为全能的研发或决策助理;在生活中,它也能帮你规划复杂的旅行、购物攻略,不再丢给你一堆链接,而是直接输出一份靠谱、可执行的方案。

未来,我们还会继续探索多模态、反思式智能体这些更有趣的方向。

我们希望,AI搜索不是一个冷冰冰的工具框,而是真正成为每个人思考和创造的「AI伙伴」。

相关文章

人工智能企业

更多>>

人工智能硬件

更多>>

人工智能产业

更多>>

人工智能技术

更多>>
AI云资讯(爱云资讯)立足人工智能科技,打造有深度、有前瞻、有影响力的泛科技媒体平台。
合作QQ:1211461360微信号:icloudnews