阿里、浙大联合推出迁移学习模型「DEPARA」入选CVPR 2020:可将单个AI模型训练从“月”缩短至“天”
2020-03-28 09:58:39AI云资讯863
近日,浙江大学与阿里安全的研究员联合编写的论文《DEPARA: Deep Attribution Graph for Deep Knowledge Transferability》收录至CVPR 2020 Oral。其中介绍了一种通过迁移学习法,高效打造AI深度模型、应对海量应用场景的 “AI训练师助手”。
旨在让AI训练模型面对新场景时不用从头学习,而是在已有模型上进行迁移,从而迅速获得相同能力的AI模型,进而缩短模型训练周期,甚至是从一个月缩短为一天。

据阿里安全图灵实验室高级算法专家析策介绍,例如在内容审核领域,不同场景的AI模型需要重新训练,以确保识别准确率而牺牲掉了时间成本。这些预训练的深度模型已消耗了大量训练时间以及大规模高质量的标注数据等昂贵的计算资源。
DEPARA沿着这条思路,以提升预训练的模型的使用程度,减少针对新场景的模型训练对时间以及数据的依赖。目前实现这一目标最流行的方法是迁移学习。

浙江大学和阿里安全发现,两个预训练深度模型所提取的特征之间的迁移能力可由它们对应的深度归因图谱之间的相似性来衡量。相似程度越高,从不同的预训练深度模型中获得的特征相关性就越大,特征的相互迁移能力也就越强。而且,“AI训练师助手”还知道从什么模型迁移知识,用模型的哪个部分迁移能最好地完成任务。也就是说,他们发现了让小白模型向AI深度模型学习的高效学习方法。
“在这种方法的指导下,单个AI模型的生产周期从1个月降到1天,我们就能更快地发现不同的内容风险。”析策谈论到。
相关文章
- 福客AI获阿里战略投资,让AI Agent成为电商企业新的生产力
- 阿里前同学推出零门槛 AI 开发工具 AgentMa,一句话生成可上线应用
- 阿里云推出企业级Agent构建平台JVS Crew:零代码“建龙虾工厂”
- 阿里妈妈AI万相:万相智识、万相智品、万相智造与万相智投的电商经营逻辑解析
- 经纬天地(02477.HK)换帅:阿里系高管入局,FoPay的战略意图与落地挑战
- 至强® 6处理器在阿里云第九代ECS实例中的应用案例:货拉拉大促高并发实践
- 合合信息亮相2026金融AI联盟大会,携手阿里云共同启动“超级智能体计划”
- 大模型智能体行业元年来临,腾讯/阿里/微美全息集体锁定AI+Agent高增长赛道!
- 当虹科技获评阿里“玄铁优选伙伴” 加速适配新一代旗舰CPU
- 阿里云数字短信全量开放,终端全覆盖实现营销短信点击率3倍提升
- 杭州维丽杰携手阿里巴巴 达成JBP深度战略合作
- 阿里云Q3财报:增速36%创新高,AI连续三位数增长!
- 上海数据集团、阿里云、浩鲸科技深化战略合作 发力AI时代数据要素
- AWE 2026 展会盛大启幕,阿里巴巴/微美全息锚定智能眼镜强势加入“百镜大战”
- 连登顶会!阿里云研究成果大幅提升运维智能精度与效率
- 阿里云金山算力中心加速投产,基于“真武”芯片建设超大规模算力中心
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源









