商汤科技宣布通用视觉研究平台OpenGVLab正式开源
2022-02-26 18:21:23爱云资讯
2月25日,商汤科技正式对外宣布通用视觉平台OpenGVLab正式发布并开源,开放内容包括超高效预训练模型,和千万级精标注、十万级标签量的公开数据集,将为全球开发者提升各类下游视觉任务模型训练提供重要支持。
同时,OpenGVLab还同步开放业内首个针对通用视觉模型的评测基准,便于开发者对不同通用视觉模型的性能进行横向评估和持续调优。
据了解,去年11月,由上海人工智能实验室联合商汤科技、香港中文大学、上海交通大学,联合发布的通用视觉技术体系“书生”(INTERN)。OpenGVLab继承了“书生”体系的技术优势,其开源的预训练模型具有超高的性能和通用性。
具体来看,相较于当前最强开源模型(OpenAI 于2021年发布的CLIP),OpenGVLab的模型可全面覆盖分类、目标检测、语义分割、深度估计四大视觉核心任务,在准确率和数据使用效率上均取得大幅提升。基于同样的下游场景数据,开源模型在分类、目标检测、语义分割及深度估计四大任务26个数据集上,平均错误率分别降低了40.2%、47.3%、34.8%和9.4%。开源模型在分类、检测、分割和深度估计中,仅用10%的下游训练数据就超过了现有其他开源模型。
商汤方面介绍,使用此模型,研究人员可以大幅降低下游数据采集成本,用极低的数据量,即可快速满足多场景、多任务的AI模型训练。
OpenGVLab还提供多种不同参数量、不同计算量的预训练模型,以满足不同场景的应用。模型库中列出了多个模型,其在ImageNet的微调结果和推理资源、速度,相比于之前的公开模型均有不同程度的性能提升。
超大量级的精标注数据集不仅整合了现有的开源数据集,还通过大规模数据图像标注任务,实现了对图像分类、目标检测以及图像分割等任务的覆盖,数据总量级近七千万。开源范围涵盖千万级精标注数据集和十万级标签体系。
伴随OpenGVLab的发布,上海人工智能实验室还开放了业内首个针对通用视觉模型的评测基准,弥补通用视觉模型评测领域的空白。
此外,商汤方面表示,目前OpenGVLab开源平台(opengvlab.shlab.org.cn)已正式上线,供各界研究人员访问和使用,后续项目还将开通在线推理功能,供所有对人工智能视觉技术感兴趣的社会人士自由体验。
- 世界互联网大会十周年,商汤科技元萝卜AI下棋机器人引围观
- 商汤科技元萝卜AI下棋机器人亮相“五智会”,助推棋类文化与数字技术深度融合
- 展台变道场,商汤科技元萝卜AI下棋机器人在Tech G以棋会友
- 商汤科技联合团队获CVPR最佳论文,推出首个“感知决策一体化”自动驾驶通用大模型
- 商汤科技发布SenseEarth 3.0智能遥感云平台,以AI遥感大模型开创DaaS创新服务模式
- 商汤科技徐立:构建AI赋能的新一代人工智能生成工具 帮助众多开发者
- 商汤科技领跑2022年AI软件市场,多个领域蝉联市场第一
- 商汤科技携手中原地产,开启虚实结合沉浸式“空间元宇宙”看房新体验
- 商汤科技发布元宇宙伦理白皮书,提出“以实为本”的数字世界发展观
- 商汤科技张望:AI治理需要适应技术创新节奏,做到张弛有度
- 商汤科技携手F1顶级车队 持续探索以AI优化车队表现
- 商汤科技助力国学普及,全国首个“元萝卜人工智能象棋试点学校”落户广州
- 商汤科技发布四大平台体系,以标准化驱动AI产业爆发增长
- 商汤科技开启智能交通AI运营新时代,向低碳、高效运营加速迈进
- 商汤科技71篇论文入选CVPR 2022创新高 引领AI技术与产业创新发展
- 商汤科技宣布通用视觉研究平台OpenGVLab正式开源