传音影像团队图像超分辨领域的论文被国际计算机视觉顶级会议ICCV 2023录用
2023-10-31 14:26:07AI云资讯1708
近日,国际计算机视觉大会 ICCV 2023(International Conference on Computer Vision,简称ICCV)在法国巴黎召开。传音影像团队与哈尔滨工业大学机器学习研究中心合作完成的图像超分辨领域的论文“MetaF2N: Blind Image Super-Resolution by Learning Efficient Model Adaptation from Faces”被ICCV 2023接收。该论文为图像复原领域的技术难题提供了新思路,且能应用在智能移动终端产品图像和视频功能上,具有广泛的应用场景。

ICCV国际计算机视觉大会每2年举办一次,由IEEE(Institute of Electrical and Electronics Engineers,简称IEEE)主办,与计算机视觉模式识别大会(IEEE Conference on Computer Vision and Pattern Recognition,CVPR)、欧洲计算机视觉大会(European Conference on Computer Vision,ECCV)并称为计算机视觉三大顶级会议。ICCV属于CCF A(Core Conference Ranking A)类会议,录用率在20%-30%之间,在计算机视觉领域具备极高的学术影响力。本届会议共收到全球8068篇论文投稿,2160篇被录取,录用率为26.77%。


图像超分辨率技术旨在通过先进的计算机视觉算法和深度学习方法,将低清晰度的图像转换为高清晰度的图像,从而恢复丢失的细节和增强图像质量。随着深度学习技术的发展,在已知图像的退化设定下,很多基于深度神经网络的图像超分辨算法已经取得了高质量的复原效果。但是由于真实世界图像退化的复杂性与多样性,算法的实际应用场景往往是退化未知的场景。因此,如何在未知场景下取得优越的图像超分辨效果,成为了图像复原领域一项重要的技术难题。
此次传音影像部在ICCV上发表的论文MetaF2N充分利用了人脸本身五官所具有的结构性先验,在模型的训练及推理过程中加入了元学习(Meta-Learning)框架,通过人脸特有的先验信息对整张图像的退化类型进行了隐式估计。同时,MetaF2N还利用人脸权重估计网络MaskNet对人脸先验信息进行了评估与权重分配,来预防不准确的人脸先验信息对结果产生的负面影响,并在对应的数据集上实现了领先的图像超分辨效果。

、
随着自媒体平台的兴起和短视频的普及,用户对于显示内容与摄影效果的清晰程度也有了更高的要求。除了对图像增强外,图像超分辨率技术也被广泛应用于视频领域,通过将低分辨率视频帧转换为高分辨率,可以显著提高视频画质和清晰度。此次论文研究成果,也可作为高清人像复原技术向通用图像复原技术的迁移的技术研究基础,后续将应用在智能移动终端产品图像和视频功能中。
多年来,传音影像团队持续深耕移动摄影、图像技术,在相关领域不断建立和完善的技术创新体系,形成持续的创新能力,打造产品影像技术的领先优势。未来,传音影像团队将继续推进图像超分辨技术的迭代和应用,赋能公司多品牌智能终端产品,为新兴市场消费者带来更高清的影像体验。
相关文章
- 传音入选“2026中国企业全球影响力100强”,本地化创新驱动全球影响力增长
- 传音控股领航非洲手机市场:逆势稳占47%,以普惠科技筑牢数字未来
- 传音TEX AI亮相CVPR 2026:联合复旦等机构组织PVUW Workshop,深化产学研协同创新
- 首个新兴市场专属移动 AI 智能体问世 传音控股本地化模式演进升级
- 以全球视野聚顶尖人才,传音控股构筑技术创新新动能
- 传音控股Q1净利增42.9% “中高端+实用AI”双轮驱动逆周期
- 未来智能完成亿元级A+轮融资,与传音合作打造下一代AI Agent硬件
- 亮相央视《商行天下》背后:传音为中国企业出海提供新样本
- 非洲数字新基建时代 传音如何让亿万用户跨越数字鸿沟?
- 传音控股出海新篇章:共创共享,融入新兴市场数字化浪潮
- 传音控股2025年报:非洲“大本营”根基深厚,本地化构筑品牌护城河
- AI拍照解题技术新突破,传音相关研究成果入选计算机视觉顶会CVPR 2026
- 端侧AI普惠落地 生态协同升级 传音控股AI技术布局成效凸显
- 聚焦场景化声学创新 传音控股筑牢新兴市场音频技术壁垒
- 从“看见肤色”到“听到噪音”:传音本地化创新何以扎根新兴市场
- 2026走出硬件舒适区,传音控股构建AI驱动的数字生态
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 自变量机器人王昊:训练世界模型需付出“时间税”,解决模态对齐是当务之急
- 腾讯发布CodeBuddy Security,用AI Agent实现更高效的代码审计
- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代









