传音TEX AI亮相CVPR 2026:联合复旦等机构组织PVUW Workshop,深化产学研协同创新
2026-06-09 16:24:42AI云资讯1670

近日,在全球计算机视觉领域顶级学术会议CVPR 2026期间,由传音控股TEX AI联合复旦大学、上海财经大学、哈佛大学、浙江大学等国内外知名高校和研究机构共同组织的第五届真实世界像素级视频理解研讨会(The 5th Pixel-level Video Understanding in the Wild Workshop,PVUW 2026)成功举办。
作为本届Workshop的重要组织方和赞助单位,传音TEXAI深度参与研讨会议题设计、挑战赛组织以及学术交流活动,与全球顶尖学者和研究团队共同探讨视频理解、多模态学习、具身智能等前沿方向的发展趋势,持续强化传音在国际人工智能学术生态中的参与度与影响力。开幕环节中,主办方特别感谢传音对挑战赛和研讨会的支持,并表示产业界的积极参与对于推动前沿技术创新和应用落地具有重要意义。

共探多模态智能未来
CVPR(Conference on Computer Vision and Pattern Recognition)是全球计算机视觉领域最具影响力的国际学术会议之一,被誉为计算机视觉领域“三大顶会”之首,每年汇聚来自全球高校、科研机构和科技企业的顶尖研究力量,共同展示人工智能领域最前沿的创新成果。 而PVUW Workshop自2021年创办以来,已连续举办五届,聚焦开放世界场景下的像素级视频理解研究,逐步发展为连接学术研究与产业应用的重要交流平台。
本届PVUW Workshop以“Towards More Diverse Modalities in Pixel-Level Understanding”为主题,重点关注视觉、文本、音频等多模态信息融合下的像素级理解能力,研究方向覆盖开放世界视频分割、多模态感知、智能体推理以及具身智能等热点领域,与未来智能终端的发展需求高度契合。
研讨会中,来自ETHZurich、UIUC、EPFL等高校及研究机构的多位国际学者围绕开放世界视觉理解、多模态学习、视频理解及具身智能等方向分享最新研究进展。与会专家普遍认为,多模态感知、世界模型和智能体能力正逐步成为下一代人工智能的重要基础能力,而视频理解则是连接真实世界感知与智能决策的关键桥梁。
围绕这些前沿议题, 作为PVUW的重要组成部分,本届PVUW Workshop挑战赛吸引全球135余支研究团队参与,围绕复杂场景视频目标分割、基于文本的指向性视频分割以及基于音频的指向性视频分割等任务展开技术比拼。本届赛事新增的音频赛道,进一步推动了视频理解从单一视觉模态向视觉、文本、音频协同理解发展,为更加自然的人机交互方式提供了新的研究方向。整体来看,挑战赛中涌现出的创新方案充分展现了全球研究社区在多模态智能方向的快速发展,也为未来智能终端视觉理解能力演进提供了重要参考。

深化产学研协同,加速AI技术成果转化
近年来,传音持续加强与国内外高校及科研机构的合作交流,与复旦大学等高校保持长期稳定的合作关系,围绕计算机视觉、多模态智能、视频理解等前沿方向开展联合研究与人才培养,共同推动前沿技术创新与产业应用落地。
依托高校在基础研究领域的学术优势,以及企业在真实场景、产品落地和全球用户服务方面的实践经验,传音持续加强在计算机视觉、多模态智能、大模型及AI Agent等关键技术突破,并将研究成果加速转化为面向全球用户的创新能力,打通“基础研究—技术创新—产品应用”的创新链条。
此次参与CVPRWorkshop组织工作,不仅体现了传音在视频理解与视觉智能领域的技术积累,也展现了公司通过产学研协同创新深度参与国际学术生态建设的能力。当前,人工智能正加速迈向多模态智能与智能体时代,产业界与学术界协同创新的重要性愈发凸显。未来,传音将坚持开放创新理念,深化与国内外高校及科研机构的产学研合作,持续探索视觉理解、多模态交互与终端智能等前沿技术方向,推动人工智能能力与全球新兴市场真实需求深度融合,为用户提供更加智能、普惠的AI体验。
相关文章
- 首个新兴市场专属移动 AI 智能体问世 传音控股本地化模式演进升级
- 以全球视野聚顶尖人才,传音控股构筑技术创新新动能
- 传音控股Q1净利增42.9% “中高端+实用AI”双轮驱动逆周期
- 未来智能完成亿元级A+轮融资,与传音合作打造下一代AI Agent硬件
- 亮相央视《商行天下》背后:传音为中国企业出海提供新样本
- 非洲数字新基建时代 传音如何让亿万用户跨越数字鸿沟?
- 传音控股出海新篇章:共创共享,融入新兴市场数字化浪潮
- 传音控股2025年报:非洲“大本营”根基深厚,本地化构筑品牌护城河
- AI拍照解题技术新突破,传音相关研究成果入选计算机视觉顶会CVPR 2026
- 端侧AI普惠落地 生态协同升级 传音控股AI技术布局成效凸显
- 聚焦场景化声学创新 传音控股筑牢新兴市场音频技术壁垒
- 从“看见肤色”到“听到噪音”:传音本地化创新何以扎根新兴市场
- 2026走出硬件舒适区,传音控股构建AI驱动的数字生态
- 传音联合IDC发布AI全场景降噪技术白皮书,聚焦新兴市场复杂噪声环境
- 惠科股份获传音表彰,深化协同共筑未来
- 打破影像内卷!MWC 2026传音以实用型AI重构镜头语言
人工智能企业
更多>>人工智能硬件
更多>>- 上海智位机器人(DFRobot) 发布 seeMote Cap 与 seeMote Cube,帮助 Apple Vision Pro 开发者把真实工具带入 visionOS 应用
- 源自老牌科研院所积淀,默克蒂森全系列传感器与工控仪表赋能工业智造
- From AI, For AI:艾利特如何让机器人成为AI产业的“关键推动者”?
- 地表最强风冷,ROG玩家国度 枪神10 超竞版系列游戏本开售
- 双奖加冕丨深度探索协作焊接能力边界,珞石机器人亮相恰佩克盛会
- Shokz韶音举办2026运动嘉年华,开启「随我天生乐动」海边乐动假日
- IDC报告:又一家国产存储厂商进入加速期,英韧科技靠PCIe与SATA双线布局突围
- 落地全场景AI存力!佰维存储COMPUTEX 2026台北展圆满收官
人工智能产业
更多>>人工智能技术
更多>>- 腾讯发布CodeBuddy Security,用AI Agent实现更高效的代码审计
- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力









