商汤科技宣布通用视觉研究平台OpenGVLab正式开源
2022-02-26 18:21:23AI云资讯1539
2月25日,商汤科技正式对外宣布通用视觉平台OpenGVLab正式发布并开源,开放内容包括超高效预训练模型,和千万级精标注、十万级标签量的公开数据集,将为全球开发者提升各类下游视觉任务模型训练提供重要支持。
同时,OpenGVLab还同步开放业内首个针对通用视觉模型的评测基准,便于开发者对不同通用视觉模型的性能进行横向评估和持续调优。

据了解,去年11月,由上海人工智能实验室联合商汤科技、香港中文大学、上海交通大学,联合发布的通用视觉技术体系“书生”(INTERN)。OpenGVLab继承了“书生”体系的技术优势,其开源的预训练模型具有超高的性能和通用性。
具体来看,相较于当前最强开源模型(OpenAI 于2021年发布的CLIP),OpenGVLab的模型可全面覆盖分类、目标检测、语义分割、深度估计四大视觉核心任务,在准确率和数据使用效率上均取得大幅提升。基于同样的下游场景数据,开源模型在分类、目标检测、语义分割及深度估计四大任务26个数据集上,平均错误率分别降低了40.2%、47.3%、34.8%和9.4%。开源模型在分类、检测、分割和深度估计中,仅用10%的下游训练数据就超过了现有其他开源模型。
商汤方面介绍,使用此模型,研究人员可以大幅降低下游数据采集成本,用极低的数据量,即可快速满足多场景、多任务的AI模型训练。
OpenGVLab还提供多种不同参数量、不同计算量的预训练模型,以满足不同场景的应用。模型库中列出了多个模型,其在ImageNet的微调结果和推理资源、速度,相比于之前的公开模型均有不同程度的性能提升。
超大量级的精标注数据集不仅整合了现有的开源数据集,还通过大规模数据图像标注任务,实现了对图像分类、目标检测以及图像分割等任务的覆盖,数据总量级近七千万。开源范围涵盖千万级精标注数据集和十万级标签体系。
伴随OpenGVLab的发布,上海人工智能实验室还开放了业内首个针对通用视觉模型的评测基准,弥补通用视觉模型评测领域的空白。
此外,商汤方面表示,目前OpenGVLab开源平台(opengvlab.shlab.org.cn)已正式上线,供各界研究人员访问和使用,后续项目还将开通在线推理功能,供所有对人工智能视觉技术感兴趣的社会人士自由体验。
相关文章
- 上海博物馆×商汤科技:AI助手上线,逛馆告别“人挤人”
- 商汤科技与正大集团共探AI与实体经济融合新机遇
- 商汤科技连续九年领跑中国计算机视觉市场,CV 2.0时代再显龙头实力
- 曦望与商汤科技、无极资本达成战略合作,共拓中国AI算力生态新高地
- 值得买科技与商汤科技达成战略合作,共聚WAIC探索消费智能体新机遇
- 商汤科技即将发布“日日新6.5”,多项产品升级驱动生产力革新和交互升级
- 商汤科技计划进军具身智能:核心团队已初步组建完毕
- 商汤科技将在2025WAIC发布日日新6.5大模型及具身智能平台
- 中韩科技对话再升级,韩国高规格代表团到访商汤科技
- 国内首家!商汤科技大装置万象获得中国信通院“大模型推理平台”最高评级认证
- 云知声与商汤科技达成战略合作 推动多模态智能交互协同进化
- 商汤科技与云知声达成战略合作 推动多模态智能交互协同进化
- 想法流x商汤科技大装置:端到端全栈赋能,造就现象级应用
- 商汤科技担当引领者,牵动XR及虚拟数字人标准化未来
- 商汤科技当选工信部人工智能标准技术委员会首届委员单位
- 商汤科技董事长徐立:强化创新,以人工智能助力高质量发展
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源









