PPIO上线百度文心4.5系列开源模型6月30日,百度正式开源文心大模型4.5系列模型,涵盖47B、3B激活参数的混合专家(MoE)模型,与0.3B参数的稠密型模型等10款模型,并实现预训练权重和推理代码的完全开源,PPIO在第一时间完成接入并上线。2天前999
最高10倍加速!北京大学联合腾讯优图实验室将 GQA 改造成 MLA形式Multi-Head Latent Attention(MLA)随着DeepSeek的火爆,成为大家关注的热点。然而DeepSeek V2原文中只通过消融实验验证MLA的训练效果好于MHA,并没有为此提供理论保障。研究人员纷纷下场研究不同设计的能力对比,例如苏剑林提出三个猜想,并通过实验验证注意力头的维度是关键因素1星期前1397
传音多媒体团队揽获CVPR NTIRE 2025两项挑战赛冠亚军,推动视频画质升级在计算机视觉领域最具影响力的国际竞赛 CVPR NTIRE 2025中,传音多媒体团队与上海交通大学图像所MediaLab联合团队分别斩获高效超分辨率挑战赛(NTIRE 2025 Efficient Super-Resolution Challenge)第一名,短视频UGC图像超分辨率挑战赛(NTIRE 2025 Short-form UGC Image Super-Resolution Challenge)第二名,展现了传音在视频画质领域的深厚积累与领先实力。1星期前1175
让AI成为服装行业的新引擎:Style3D引领智能辅助制版变革Style3D 此次入选CVPR的研究成果,创新性地结合了大语言模型和参数化版型技术,将服装款式设计高效转换为结构化版型,实现AI辅助制版;同时能够自动组织构建版片间缝合关系,生成高精度3D服装模型。1星期前1902
ACL 2025 | 腾讯优图实验室大模型4篇论文入选,涵盖智能体、角色扮演、自动推理等方向ACL即国际计算语言学年会(Annual Meeting of the Association for Computational Linguistics),是自然语言处理(NLP)领域的顶级学术会议之一,ACL论文通常代表了该领域的前沿研究成果。2025年是该会议的第63届,将于7月27日至8月1日在奥地利维也纳举行。1星期前1367
值得买科技与人大高瓴联合研究成果入选计算机视觉顶级会议CVPR20256月11日-15日,2025国际计算机视觉与模式识别会议(Conference on Computer Vision and Pattern Recognition 2025,简称CVPR2025)在美国田纳西州召开。值得买科技与中国人民大学高瓴人工智能学院在多模态领域的最新联合研究成果《图像转有声视频》(《Animate and Sound an Image》)成功入选CVPR2025会议。2星期前1810
国内首个搜索超级智能体发布!纳米AI超级搜索上新8大核心能力当搜索不再只是获取信息的工具,而能直接帮你完成购物决策、行程规划甚至输出专业报告——这一愿景随着纳米AI超级搜索智能体的发布成为现实。2星期前1203
Soul成果亮眼:实时人像视频生成研究成果被CVPR2025录用AI领域再度传来重磅消息。新型社交平台Soul App的技术论文《Teller: Real-Time Streaming Audio-Driven Portrait Animation with Autoregressive Motion Generation》,成功被人工智能领域顶会CVPR 2025录用。这不仅是Soul在技术研发上的一次重大突破,更意味着其在AI社交领域的探索,正逐步引领行业走向新的阶段。4星期前1579
超越ControlNet!腾讯优图实验室联合复旦大学提出AI生图新框架,解决多条件生成难题自回归的机制通过Image Stream Block(ISB)能够注意到各类视觉特征中已被挑选的patch和备选patch的隐含关联,并基于当前时间步下图像去噪的状态获取更优的统一信号以优化流匹配路径。1个月前1670
云知声4篇论文成果入选自然语言处理顶会ACL 2025,大模型研究再获突破第63届国际计算语言学年会ACL 2025(Annual Meeting of the Association for Computational Linguistics,简称ACL)论文接收结果正式公布。云知声在此次国际学术盛会中表现卓越,共有4篇论文被接收,其中包括2篇主会论文(Main Paper)和2篇Findings。入选的4篇论文聚焦大语言模型知识溯源、图文音多模态大模型、大语言模型可解释性等关键领域,提出的创新理论和方法,为行业研究提供了新的思路。1个月前2382
Anthropic推出Claude 4大模型,擅长编程和推理,可以连干7小时Anthropic公司正式发布新一代混合推理AI模型Claude Opus 4与Claude Sonnet 4,这两款专为编程任务与复杂问题解决优化的最新产品引发行业关注。1个月前1675
OpenAI向付费版ChatGPT用户开放先进的代码生成模型GPT-4.1OpenAI宣布扩大GPT-4.1的开放范围,ChatGPT Plus、Pro及Team订阅用户现已可访问这一AI模型。1个月前1247
微软在Windows 11系统测试“嘿,Copilot!”语音唤醒功能微软正在测试Copilot语音新功能,Windows 11用户可通过“嘿,Copilot!“语音指令唤醒应用进行对话。已获取更新的Windows内测用户在手动启用该功能后即可体验。1个月前1411
昆仑万维正式开源Matrix-Game:从图像出发构建可控交互世界,重塑交互式世界生成标杆5月13日,昆仑万维正式开源(17B+)Matrix-Game大模型,即Matrix-Zero世界模型中的可交互视频生成大模型。Matrix-Game是Matrix系列在交互式世界生成方向的正式落地,也是工业界首个开源的10B+空间智能大模型,它是一个面向游戏世界建模的交互式世界基础模型,专为开放式环境中的高质量生成与精确控制而设计。1个月前2144
微云全息融合Gamma校正与全变分算法, 非线性调整图像亮度以提升对比度和清晰度低照度图像通常由于光照不足而导致细节模糊、对比度低等问题,给图像的观看和分析带来困难。全变分算法是一种常用的图像增强方法,它能够通过最小化图像梯度的总变化来增强图像的边缘和细节。然而,全变分算法在处理低照度图像时容易引入过多的噪声。1个月前1105
百度搜索发布AI开放计划,每日数亿精准搜索流量扶持优质应用4月25日,百度搜索开放平台·AI开放计划发布,免费开放数亿流量,让开发者的AI应用精准连接用户。该计划提供两种零门槛接入方案——AI应用和MCP Server。此外,百度还提供了丰厚的开发者扶持政策,开发者可在百度搜索“百度搜索开放平台”进行注册加入。2个月前1585
文心4.5Turbo、X1Turbo和多款AI应用发布!李彦宏:应用创造未来4月25日,百度创始人李彦宏在Create2025百度AI开发者大会上,发布文心大模型4.5 Turbo、文心大模型X1 Turbo、高说服力数字人、通用多智能体协作APP“心响”等AI新品,并宣布将帮助开发者全面拥抱MCP。2个月前1702
OpenAI发布全新人工智能模型o3和o4-mini,首次实现图像思考4月16日,OpenAI发布两款全新人工智能推理模型:自称为最强推理模型的o3,以及以小巧体积和成本实现卓越性能的更轻量高速模型o4-mini。o3和o4-mini将具备图像思考能力,这意味着它们能将图像直接整合到推理链条中。2个月前8425
OpenAI即将推出GPT-4.1版本据知情人士向外媒透露,OpenAI即将发布多款新AI模型。其中包括预计将命名为GPT-4.1的升级版本,消息人士称这是对GPT-4o多模态模型的全面革新。2个月前31659
谷歌最新发布Agent2Agent 协议 (A2A)谷歌发布了 Agent2Agent (A2A) 协议,旨在补充 Anthropic 的模型上下文协议 (MCP),后者为代理提供了实用的工具和上下文。这是一个由 50 多家技术合作伙伴共同贡献的开放协议。A2A 协议旨在使 AI 代理能够在各种企业平台之间进行通信、安全地交换信息和协调行动,而无需考虑其底层技术或供应商。2个月前31712