景联文科技 I 助力自动驾驶企业完成向数据驱动的端到端开发流程转型

2022-03-08 09:50:23爱云资讯

自动驾驶车企引入数据驱动的端到端的开发流程

盘点车企在自动驾驶领域的布局,除了特斯拉、理想、蔚来、小鹏等造车新势力,传统车企也愈加重视自动驾驶业务,纷纷成立独立子公司专注于智能驾驶的开发,如一汽集团成立人工智能子公司一汽(南京)科技开发有限公司;长城汽车成立毫末智行;上汽集团筹建软件中心上汽零束等。

自动驾驶行业专家们使用基于深度学习的开发流程——也就是数据驱动的端到端的开发流程来研发自动驾驶系统,基本按照如下思路:数据采集->数据存储->数据预处理->数据挖掘->数据标注->模型训练->仿真测试->部署发布。在这个环节中使用的工具链决定了整个系统开发的效率。

自动驾驶是2020至今AI基础数据服务支出规模最大的细分行业,同时也是最具增长潜力的行业,主要数据采集需求包括车内驾驶舱以及车外道路环境感知等场景。数据处理包括对摄像头数据、毫米波雷达数据、激光雷达点云数据进行去噪清洗,去除地理位置、人脸、车牌等敏感信息并且统一格式。数据处理完成后对数据进行标注,标注类型大致分为2D、3D目标物标注、联合标注、车道线标注和语义分割等。

由于具体采集规范和标注质检流程异常繁琐,对自动驾驶车企来说数据采集标注的外包化和对高质低价的追求也趋于明显。

IDC发布的《中国人工智能基础数据服务市场追踪报中》中提出标注质量、标注效率、知识经验、数据安全、整体成本五个维度,是用户对AI数据服务商最重要的能力要求。景联文科技是AI基础数据服务行业的头部供应商,也是长三角地区最大的自动驾驶数采集标注公司,拥有10年专业数据采集经验,成立至今已为【阿里巴巴】,【华为】,【美团】,【海康威视】等数百家AI头部企业提供数据解决方案。

自动驾驶场景中应用较为广泛的数据标注类型

在以深度学习为主的感知模型中,主流的深度学习训练方法还是监督学习,用这种方法训练,需要向模型“喂养”海量有“真值(Ground Truth)”的数据。模型训练对标注数据的质量要求很高,数据质量直接决定了训练出来的模型精度高低,标注质量又和标注成本密切相关,选择小型标注团队的廉价劳动力能否满足开发者们的需求是一个问题,高质量的标注要求,必然导致人力成本上升,低价格则会影响标注质量,高质量和低价格是一个需要开发者平衡的矛盾。

景联文科技位于杭州,作为行业内具备一定规模的平台型厂商,为了提升标注服务的质量/价格比,大力优化标注平台实现Al数据的全生命周期管理和供应链管理,项目协同,AI人机协同,自定义权限的数据处理能力,全面支持图像、音频等数据标注需求,支持多类型标注模板,标注结果支持多种格式在线导出。支持全面标注、质检、验收和管理,开放甲方验收通道,可按照甲方要求转换格式校对数据。并研发自动化辅助标注功能,运用AI技术直接对2D图像数据进行场景分割、人脸和物体识别,自动完成标注后再由人工进行校队,标注员只需要对AI标注的数据进行检查调整即可提交进入审核,数据精准度可达99.99%,提高标注效率有效降低成本。

自动驾驶场景中应用较为广泛的数据处理标注类型除了2D图像标注,还有3D点云连续帧标注和2D3D点云融合标注。在传统逐帧标注模式之下,无论采用手动复制对象的模式还是自动复制对象的模式,标注效率都很难有所提升,景联文标注平台在依据传统标注模式优缺点的基础上引入大量算法辅助,研究出专门针对点云连续帧标注的人机协同模式“自动关键帧”,在点云自动关键帧标注模式下,用户只要对该连续帧中“起始帧”和“结束帧”进行标注,平台算法就会自动生成并调整中间帧上同一属性对象,无需逐帧复制。这种模型在保持数据准确率的基础上,使得标注效率提升至10倍以上。

景联文科技使用自研3D点云标注平台,完成国内知名高校的2D3D点云融合标注项目,标注2D图片21000张,合计标注35000个障碍物,涵盖整个小区,包括停车区,道路等日常活动区域;标注点云图片共计5000帧,合计20000个点云框,主要模拟居民小区内日常行车及停车环境,交付的数据合格率均达到99%。

自动驾驶场景数据标注项目常见问题和景联文科技解决方案

随着产业链的专业化分工愈加清晰,AI产业对训练数据的拓展性需求和前瞻性需求均快速增长,并且随着需求方对训练数据质量的要求不断提高,垂直场景的定制化训练数据需求成为主流,需求方市场对训练数据的要求逐渐向精细化转型,除此之外自动驾驶领域标注项目还存在着其他难度。

自动驾驶领域标注项目数据量和单个数据文件普遍较大,对数据精度的要求更高,因此对外包数据公司的标注团队规模、自动驾驶项目执行经验、服务器、平台的承载能力有着更高的要求。景联文科技在全国拥有四个大型标注基地,为1000+数据标注师提供综合标注技能培训,通过项目轮转形式使90%以上标注人员执行过自动驾驶场景标注项目,选择大专以上学历且对自动驾驶算法需求有一定理解能力的标注师专门负责2D3D融合等高难度标注项目,同时对标注平台服务器、企业专线宽带、办公电脑配置进行全面升级,支持对大量数据同时进行标注操作并保证其加载速率。

同时针对自动驾驶标注项目易出现需求临时变更的情况,景联文科技为需求方配备多次执行过自动驾驶标注项目的项目经理和商务人员对接服务,支持24小时加班和值班随时沟通可能存在的需求变更,平台研发团队随时响应标注工具调整需求,在项目初期提前部署,提前开始,确保数据提前交付并确保标注准确率。

通过标注平台实现标审分离,完善平台风险管控机制,且设置了严格的数据隐私安全保障措施。其核心原则为数据绝不二次利用和签订数据采集授权协议;同时设置了数据隔离、私有化部署等安全流程和技术。

做全球AI行业客户的数据参谋。

自动驾驶数据采集标注项目联系我们。

相关文章
热门文章
头条文章
重点文章
推荐文章
热点文章
关于我们|联系我们|免责声明|会展频道
冀ICP备2022007386号-1 冀公网安备 13108202000871号 爱云资讯 Copyright©2018-2023