服务乡村经营新业态,共富AI智能体发布!此款AI智能体,由腾讯SSV为村共富乡村、腾讯云智能、腾讯优图实验室、腾讯SSV技术生态部联合打造,内置腾讯混元与DeepSeek双模型引擎,由腾讯云智能、腾讯优图实验室提供智能体支持,腾讯SSV为村共富乡村联合SSV技术生态部开发产品应用。4天前1779
脑虎科技运动语言双解码技术获国际顶刊《Nature》认可国内脑机接口领军企业脑虎科技的两项临床试验成果——实时运动解码与实时汉语言解码技术,均获该刊高度关注与报道,标志着其核心技术获得国际顶级学术期刊的认可。2星期前3783
Interspeech 2025 | 腾讯优图实验室4篇论文入选,涵盖超声波活体检测、神经语音编解码、语音合成等方向Interspeech 2025会议发出了审稿结果通知。Interspeech是由国际语音通信协会(ISCA)组织的语音研究领域的顶级会议之一,是全球最大的综合性语音信号处理领域的科技盛会。本届会议以“Fair and Inclusive Speech Science and Technology”为主题,内容涵盖语音识别、语音合成、语音编码、语音增强、自然语言处理等多个领域。3星期前4316
ICCV 2025 | 腾讯优图实验室大模型8篇论文入选,涵盖风格化人脸识别、AI生成图像检测、多模态大语言模型等方向ICCV 2025大会共收到11239份有效投稿,刷新历史记录,经过严格评审,最终仅接受2698篇论文,录用率为24%。今年,腾讯优图实验室共有8篇论文入选ICCV 2025,内容涵盖风格化人脸识别、AI生成图像检测、多模态大语言模型等方向,展现了优图实验室在人工智能领域的技术能力与创新突破。4星期前4806
PPIO上线百度文心4.5系列开源模型6月30日,百度正式开源文心大模型4.5系列模型,涵盖47B、3B激活参数的混合专家(MoE)模型,与0.3B参数的稠密型模型等10款模型,并实现预训练权重和推理代码的完全开源,PPIO在第一时间完成接入并上线。1个月前1899
最高10倍加速!北京大学联合腾讯优图实验室将 GQA 改造成 MLA形式Multi-Head Latent Attention(MLA)随着DeepSeek的火爆,成为大家关注的热点。然而DeepSeek V2原文中只通过消融实验验证MLA的训练效果好于MHA,并没有为此提供理论保障。研究人员纷纷下场研究不同设计的能力对比,例如苏剑林提出三个猜想,并通过实验验证注意力头的维度是关键因素1个月前2324
传音多媒体团队揽获CVPR NTIRE 2025两项挑战赛冠亚军,推动视频画质升级在计算机视觉领域最具影响力的国际竞赛 CVPR NTIRE 2025中,传音多媒体团队与上海交通大学图像所MediaLab联合团队分别斩获高效超分辨率挑战赛(NTIRE 2025 Efficient Super-Resolution Challenge)第一名,短视频UGC图像超分辨率挑战赛(NTIRE 2025 Short-form UGC Image Super-Resolution Challenge)第二名,展现了传音在视频画质领域的深厚积累与领先实力。1个月前1943
让AI成为服装行业的新引擎:Style3D引领智能辅助制版变革Style3D 此次入选CVPR的研究成果,创新性地结合了大语言模型和参数化版型技术,将服装款式设计高效转换为结构化版型,实现AI辅助制版;同时能够自动组织构建版片间缝合关系,生成高精度3D服装模型。1个月前3950
ACL 2025 | 腾讯优图实验室大模型4篇论文入选,涵盖智能体、角色扮演、自动推理等方向ACL即国际计算语言学年会(Annual Meeting of the Association for Computational Linguistics),是自然语言处理(NLP)领域的顶级学术会议之一,ACL论文通常代表了该领域的前沿研究成果。2025年是该会议的第63届,将于7月27日至8月1日在奥地利维也纳举行。1个月前2069
值得买科技与人大高瓴联合研究成果入选计算机视觉顶级会议CVPR20256月11日-15日,2025国际计算机视觉与模式识别会议(Conference on Computer Vision and Pattern Recognition 2025,简称CVPR2025)在美国田纳西州召开。值得买科技与中国人民大学高瓴人工智能学院在多模态领域的最新联合研究成果《图像转有声视频》(《Animate and Sound an Image》)成功入选CVPR2025会议。1个月前2055
国内首个搜索超级智能体发布!纳米AI超级搜索上新8大核心能力当搜索不再只是获取信息的工具,而能直接帮你完成购物决策、行程规划甚至输出专业报告——这一愿景随着纳米AI超级搜索智能体的发布成为现实。1个月前1395
Soul成果亮眼:实时人像视频生成研究成果被CVPR2025录用AI领域再度传来重磅消息。新型社交平台Soul App的技术论文《Teller: Real-Time Streaming Audio-Driven Portrait Animation with Autoregressive Motion Generation》,成功被人工智能领域顶会CVPR 2025录用。这不仅是Soul在技术研发上的一次重大突破,更意味着其在AI社交领域的探索,正逐步引领行业走向新的阶段。1个月前1815
超越ControlNet!腾讯优图实验室联合复旦大学提出AI生图新框架,解决多条件生成难题自回归的机制通过Image Stream Block(ISB)能够注意到各类视觉特征中已被挑选的patch和备选patch的隐含关联,并基于当前时间步下图像去噪的状态获取更优的统一信号以优化流匹配路径。2个月前1895
云知声4篇论文成果入选自然语言处理顶会ACL 2025,大模型研究再获突破第63届国际计算语言学年会ACL 2025(Annual Meeting of the Association for Computational Linguistics,简称ACL)论文接收结果正式公布。云知声在此次国际学术盛会中表现卓越,共有4篇论文被接收,其中包括2篇主会论文(Main Paper)和2篇Findings。入选的4篇论文聚焦大语言模型知识溯源、图文音多模态大模型、大语言模型可解释性等关键领域,提出的创新理论和方法,为行业研究提供了新的思路。2个月前4018
昆仑万维正式开源Matrix-Game:从图像出发构建可控交互世界,重塑交互式世界生成标杆5月13日,昆仑万维正式开源(17B+)Matrix-Game大模型,即Matrix-Zero世界模型中的可交互视频生成大模型。Matrix-Game是Matrix系列在交互式世界生成方向的正式落地,也是工业界首个开源的10B+空间智能大模型,它是一个面向游戏世界建模的交互式世界基础模型,专为开放式环境中的高质量生成与精确控制而设计。2个月前2344
百度搜索发布AI开放计划,每日数亿精准搜索流量扶持优质应用4月25日,百度搜索开放平台·AI开放计划发布,免费开放数亿流量,让开发者的AI应用精准连接用户。该计划提供两种零门槛接入方案——AI应用和MCP Server。此外,百度还提供了丰厚的开发者扶持政策,开发者可在百度搜索“百度搜索开放平台”进行注册加入。3个月前1764
文心4.5Turbo、X1Turbo和多款AI应用发布!李彦宏:应用创造未来4月25日,百度创始人李彦宏在Create2025百度AI开发者大会上,发布文心大模型4.5 Turbo、文心大模型X1 Turbo、高说服力数字人、通用多智能体协作APP“心响”等AI新品,并宣布将帮助开发者全面拥抱MCP。3个月前1834
谷歌最新发布Agent2Agent 协议 (A2A)谷歌发布了 Agent2Agent (A2A) 协议,旨在补充 Anthropic 的模型上下文协议 (MCP),后者为代理提供了实用的工具和上下文。这是一个由 50 多家技术合作伙伴共同贡献的开放协议。A2A 协议旨在使 AI 代理能够在各种企业平台之间进行通信、安全地交换信息和协调行动,而无需考虑其底层技术或供应商。3个月前31812
云从科技与重庆大学团队联合研发智能编程助手CoSEFA 入选国际顶会FSE 2025云从科技与重庆大学大数据与软件学院联合研发的编程智能体——CoSEFA(Code SEcurity and Fix Agent)被软件工程领域顶尖会议ACM SIGSOFT软件工程基础国际会议(FSE 2025)正式录用。4个月前46489
CVPR2025:中科视语发布首个具身物理空间大模型PhysVLM!战略布局“AI+机器人”新生态作为首创“环境感知、本体理解、决策执行”全链条技术突破的AI企业,中科视语以PhysVLM的发布为起点,正逐步构筑面向工业4.0、智慧交通、具身机器人等领域的核心技术底座,重新定义“AI+机器人”协同发展新范式。4个月前82186