爱奇艺“多模态人物识别竞赛”收官 多模态视频人物识别精准度提升至91.14%
2019-07-01 18:36:03AI云资讯1401
经过3个月的角逐,爱奇艺联合全球多媒体领域顶尖会议ACM International Conference on Multimedia(以下简称ACM MM)共同举办的多模态人物识别竞赛于近日正式落下帷幕。本次大赛,吸引了包括卡内基梅隆大学、伦敦大学学院、埃克塞特大学、清华大学、北京大学等国内外顶尖高校,以及百度、中兴、京东、美图、英伟达等知名企业在内的共255支团队同场竞技。其中,来自于北京邮电大学自动化学院、北京邮电大学网研院网络智能中心以及南京大学计算机科学与技术系的团队分别获得前三名。 获得第一名的北京邮电大学自动化学院团队将多模态视频人物识别精准度提升到了91.14%,爱奇艺携手顶尖参赛团队在多模态人物识别领域再次取得突破。此次竞赛的颁奖仪式将在10月21日至25日在法国尼斯举办的第27届ACM MM 大会上进行。

目前,全世界众多科技公司以及学术机构发布视频数据集,侧重解决视频识别各种难题。其中,牛津大学发布过VoxCeleb2数据集,包含6千多人,15万视频,侧重于解决说话人识别的问题;香港中文大学和商汤科技合作发布的包括1218人,12.7万视频CSM数据集,为了更好地检索识别视频中的说话的人物。以色列特拉维夫大学的Youtube Faces DB,拥有3425个视频片段与1595个人物,用以解决非约束环境下的人脸识别问题。此次,爱奇艺发起的多模态人物识别挑战赛中,对参赛者公布了通过严格人工标注、更具有挑战性的多模态人物数据集(iQIYI-VID-2019),包含10000名明星人物、200小时、20万条影视剧与短视频数据集,更接近实际应用场景,其中包括脸部,头部,身体及声纹4个模态的特征,为学术界及工业界利用多模态特征去更全面解决场景复杂、人体动作多变、化妆等人物识别难题提供了便利条件。参赛团队无需使用自己的计算资源去提取特征,这样大大降低该竞赛对硬件资源的门槛,吸引了更多全球顶尖优秀的学术机构团队参与,加快提升人物识别技术不断向前演进。此次拔得头筹的北京邮电大学自动化学院团队,在爱奇艺公布的4个模态特征的基础上,重新训练了对齐的人脸识别模型,利用数据增强和这5种模态信息训练完成多模态分类模型,在数据集难度提升的情况下,将多模态视频人物识别精准度由去年的88.65%提升到了91.14%,提升幅度达2.5pp,成为多模态视频人物识别竞赛中的全球最佳算法。
多模态人物识别技术精准度进一步提升意味着,爱奇艺可以通过对复杂场景下精准识别为用户带来更优的视频消费体验,进一步提升娱乐系统的效率,例如,通过识别短视频、UGC内容中模糊、侧面、距离远等复杂场景中的人物,更好地为用户精准推荐内容,加强爱奇艺个性化内容分发能力;在AI雷达中,通过对视频人物的精准识别,通过只看TA的功能让用户享受到更为个性化的互动体验;可以使HomeAI智能语音交互平台提升用户的交互体验;以及让AIWorks视频智能创作对长视频进行更精准的拆条,进一步提升爱奇艺爱创媒资系统制作爆款剧的效率等。
爱奇艺首席技术官兼基础架构和智能内容分发事业群总裁刘文峰表示,多模态人物识别竞赛不断取得突破,除了对爱奇艺娱乐生态产生重要价值之外,对人物识别技术的研发,技术成果转化效率,相关人才培养都会产生深远的影响。未来,爱奇艺将不断与国内外学术机构、行业领先者合作,不断提升前沿技术的探索与实践。
相关文章
- 现实主义大剧《生命树》开播发布会在京举行 1月30日爱奇艺全网独播
- 爱奇艺开年大剧《生命树》定档1月30日,品牌抢占CNY营销价值高地
- 爱奇艺《太平年》1月23日播出,讲述五代十国“纳土归宋”的历史故事
- 反套路穿书“天花板”回归,爱奇艺动漫《成何体统 第2季》1月25日开播
- 爱奇艺分账剧《老舅》首月分账破5500万元,创造两项行业纪录
- 爱奇艺《轧戏》1月9日上线 讲述都市追梦甜愈爱情故事
- 支持影视工业化产研协同,爱奇艺联合北京电影学院成功申报北京市重点实验室
- 爱奇艺五部制播作品荣获第16届澳门国际电视节“金莲花奖”五项大奖
- 硬核刑侦剧《罚罪2》12月25日爱奇艺全网独播 黄景瑜王传君上演兄弟对决
- 破解高并发困局,阿里云数据库MongoDB版助力爱奇艺积分系统构筑数据基石
- 燧原科技与爱奇艺签署战略合作协议,共同探索生成式AI在泛娱乐行业的技术变革
- 爱奇艺完成鸿蒙原生应用Beta版开发 携手华为共创全场景视听新体验
- 签了!英特尔与联想、爱奇艺引领加速AI PC落地
- 海信电视&爱奇艺联合画质调校,打造高品质视听方案
- 海信ULEDX新品电视接入爱奇艺帧绮映画MAX 双方联合发布“帧绮X”校准模式
- 爱奇艺朱梁出席网络视听精品创作峰会 详解影视工业化如何落地多场景“提质增效”
人工智能企业
更多>>人工智能硬件
更多>>- 忆联UH812a以极致存力破局大模型载入瓶颈,释放算力潜能
- 讯飞翻译机登陆MWC 2026,同传级沟通体验,多语种交流无压力
- 普恩志引领:2026半导体与高端制造前瞻——核心备件如何驱动产业革新与市场机遇
- 超旗舰降噪,殿堂级音质 索尼双芯超旗舰真无线降噪耳机WF-1000XM6正式发售
- 当AI学会“隐身”,手机才真正智能:三星Galaxy S26系列开启AI哲学的降维打击
- 全球首秀!讯飞AI眼镜亮相MWC,多模态同传大模型与极致轻量化设计 引领智能穿戴新风向
- 全球瞩目!荣耀携Robot Phone、Magic V6系列、荣耀MagicBook Pro 14 2026震撼亮相MWC 2026
- MWC直击:荣耀双旗舰搭载第五代骁龙8至尊版,助力智能手机下一代技术演进
人工智能产业
更多>>人工智能技术
更多>>- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench
- 在MoltBot/ClawdBot,火山方舟模型服务助力开发者畅享模型自由
- 教程 | OpenCode调用基石智算大模型,AI 编程效率翻倍
- 全国首个!上海上线规划资源AI大模型,商汤大装置让城市治理“更聪明”
- 昇思人工智能框架峰会 | 昇思MindSpore MoE模型性能优化方案,提升训练性能15%+









