腾讯优图人脸检测算法DSFD正式开源 曾刷新两项世界纪录
2019-04-11 16:16:56AI云资讯774
近日,知名开源社区Github上有个名为DSFD(DualShotFaceDetector)的算法引起了业内关注,它来自腾讯旗下AI实验室:腾讯优图团队。据悉,该算法已经被计算机视觉顶级会议CVPR2019接收,刷新了两个权威的人脸检测数据集WIDERFACE和FDDB上的新纪录。
(Github开源地址:https://github.com/TencentYoutuResearch/FaceDetection-DSFD 论文公开地址:https://arxiv.org/abs/1810.10220v2)
“三点创新”打造人脸检测领域最值得参考的代码
人脸检测算法是在图像上,检测出人脸的位置(通常以矩形框形式输出),是人脸配准、人脸属性识别、人脸核身、人脸检索等技术的基础。优图此次提出的DSFD人脸检测算法,主要有3点创新:
(1)设计了一种新的“特征增强”模块(FEM:FeatureEnhanceModule)
FEM在采用Top-Down层间信息融合的同时,在同一“感受野”内做了更多的enhancement。因此在widthanddepth上学习到了更有效的context和semantic信息。
(2)提出了“分层锚点渐进”式的代价函数监督(PLA:ProgressiveAnchorLoss)
模型采用2个层级(hierarchy),基于第一层(low-level)和第二层(high-level)的差异性,适配了不同尺寸的anchor。在训练过程中,PAL对整个模型形成了更有效的监督。
(3)设计了一种“改进的锚点匹配策略”(ImprovedAnchorMatchingStrategy)
One-stagedetector由于在输出层分配有密集的anchor,anchor与face匹配的好坏直接影响训练效果。优图的研究人员dataaugmentation过程中充分考虑了不同大小的face和各个anchor的关系,提出了一种新的数据扩增法。

(算法整体流程图)
效果的提升,来自优图不断的研究探索
随着近几年人工智能技术的发展,国内外不少机构、企业都在进行人脸检测的相关研究。来自腾讯优图的研究员们发现,虽然之前的人脸检测算法大都采用深度学习模型,并在特征学习的过程中也有采用特征金字塔网络(FeaturePyramidNetwork),但在面对遮挡、暗光、大姿态、小脸等复杂场景时,仍容易出现误检或漏检的情况。因此在FPN基础上,腾讯优图团队采用了3种不同级联方式的空洞卷积(DilatedConvolution),设计了特征增强模块FEM,充分学习到了不同感受野下的人脸特征。


(复杂场景下的人脸检测效果展示)
然而,在新算法探索的过程中,并不是一帆风顺的。项目从去年7月中旬启动,来自项目的三个核心成员,进行到第三周,检测效果已经在top5了,他们清楚,到这里还远远不够。在接下来的两个多月里,想要提升效果却越来越难。就像爬山,前面爬得很快,越到后面,对耐力和决心的要求就越高。腾讯优图高级研究员Case回忆道:“那段时间,我和其他几位同事实验了很多方案,很多时候是多个方案同时跑,甚至有些方案跑了4-5天后,发现失败了,又得做新的尝试”。失败后,几个研究员就近在工位旁边的玻璃房里,一起分析原因,开始摸索下一套试跑方案。在3个多月的反复“试跑-推翻-试跑”中,最后终于跑出一套大家都满意的算法。不负所望,该算法论文也已被CVPR2019接收。
走出实验室,真正为业务创造价值;代码开源,与同行共同探讨
算法从实验室走出来,不是立马就能直接套用到业务里。事实上,论文里的模型通常比较大,导致实时性不好。在使用时,需结合实际应用情况压缩、裁剪,整体模型会做一定的调整。目前腾讯优图的人脸检测技术已在安防、金融、社交、交通等多个应用场景落地,并在手机QQ、微众银行、天天P图等多个公司内外部产品上进行应用验证。如在安防领域,腾讯优图天眼智能安防平台以警务、安防需求为导向,面向稽查布控、刑侦办案、社会安防等多场景推出智能化海量人脸检索解决方案。

(腾讯优图天眼智能安防平台)
腾讯作为中国互联网巨头之一,近年来持续加强在AI及前沿基础科学研究的投入。2017年,腾讯对外开源节奏开始加快,主要覆盖AI、云计算、腾讯游戏、腾讯安全、小程序等相关领域。其中,腾讯优图的计算机视觉AI技术的开源,是其中重要的一环。2017年7月,腾讯优图首个AI开源项目ncnn于正式开源,是一个为手机端极致优化的高性能神经网络前向计算框架,是业内首个为移动端优化的开源神经网络推断库。一年后ncnn正式加入ONNX,AI开发者能更快实现从研究到模型的落地部署,也能更方便地在不同框架间切换,为每项任务选取最优的开发工具。截止目前,ncnn的Githubstar数已接近6000。相信随着越来越多的AI机构、企业和个人的算法开源,将驱动整个AI研究更快发展和落地。
相关文章
- SOTA达成!腾讯优图D-Search算法登顶国际AI权威榜单
- PRCV2025大会顺利召开,腾讯优图携前沿科技成果亮相现场
- 腾讯优图携Youtu-Agent开源项目亮相上海创智学院首届TechFest大会
- 拿下SOTA!腾讯优图联合厦门大学提出AIGI生成图像检测新方法
- Interspeech 2025 | 腾讯优图实验室4篇论文入选,涵盖超声波活体检测、神经语音编解码、语音合成等方向
- ICCV 2025 | 腾讯优图实验室大模型8篇论文入选,涵盖风格化人脸识别、AI生成图像检测、多模态大语言模型等方向
- 最高10倍加速!北京大学联合腾讯优图实验室将 GQA 改造成 MLA形式
- ACL 2025 | 腾讯优图实验室大模型4篇论文入选,涵盖智能体、角色扮演、自动推理等方向
- 超越ControlNet!腾讯优图实验室联合复旦大学提出AI生图新框架,解决多条件生成难题
- 喜报!腾讯优图联合项目获CSIG科技进步奖一等奖
- PRCV 2021 | 视觉AI飞速发展,腾讯优图分享内容理解新实践
- AAAI2022腾讯优图14篇论文入选,含语义分割、图像着色、人脸安全、弱监督目标定位、场景文本识别等前沿领域
- AICon2021 | 腾讯优图鄢科:以AI技术助力内容安全 促进互联网环境健康发展
- 腾讯优图人脸安全能力再获认可!优图专家入选“护脸计划”专家委员会
- 腾讯优图斩获ICCV2021 LVIS Challenge Workshop冠军及最佳创新奖
- CCAI 2021 | 腾讯优图汪铖杰:用AI生成更优更新的内容
人工智能企业
更多>>人工智能硬件
更多>>- 忆联UH812a以极致存力破局大模型载入瓶颈,释放算力潜能
- 讯飞翻译机登陆MWC 2026,同传级沟通体验,多语种交流无压力
- 普恩志引领:2026半导体与高端制造前瞻——核心备件如何驱动产业革新与市场机遇
- 超旗舰降噪,殿堂级音质 索尼双芯超旗舰真无线降噪耳机WF-1000XM6正式发售
- 当AI学会“隐身”,手机才真正智能:三星Galaxy S26系列开启AI哲学的降维打击
- 全球首秀!讯飞AI眼镜亮相MWC,多模态同传大模型与极致轻量化设计 引领智能穿戴新风向
- 全球瞩目!荣耀携Robot Phone、Magic V6系列、荣耀MagicBook Pro 14 2026震撼亮相MWC 2026
- MWC直击:荣耀双旗舰搭载第五代骁龙8至尊版,助力智能手机下一代技术演进
人工智能产业
更多>>人工智能技术
更多>>- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench
- 在MoltBot/ClawdBot,火山方舟模型服务助力开发者畅享模型自由
- 教程 | OpenCode调用基石智算大模型,AI 编程效率翻倍
- 全国首个!上海上线规划资源AI大模型,商汤大装置让城市治理“更聪明”
- 昇思人工智能框架峰会 | 昇思MindSpore MoE模型性能优化方案,提升训练性能15%+









