澳鹏Appen发布全新《人工智能与机器学习现状年度报告》
2021-08-24 12:32:22AI云资讯1360

2021澳鹏Appen《人工智能与机器学习现状年度报告》
2021全球AI市场5大发展趋势
“七年前,当我们第一次开始调研AI与机器学习现状时,全球企业都迫不及待想要启动AI项目,但并未取得实质性进展。如今,AI已被视为企业生存的核心,而相关调研结果也证实了这一点:企业增加了AI预算和负责该领域的技术人员,同时对外部训练数据提供商也更加依赖。”
--澳鹏Appen首席执行官Mark Brayan
1. AI发展的瓶颈:高质量数据
研究机构O'REILLY最近发布的一份调查报告显示,人工智能应用的两大瓶颈:一是缺乏技术熟练的员工;二是缺乏数据资源(或数据存在质量问题)。事实上,大多数AI项目迟迟未能投入到“实战”阶段,也反映出在AI研究过程中,数据科学家在获取高质量数据时所面临的挑战和成本。此时,寻求外部专业机构的支持就显得尤为重要。
2. 更精准的AI应用场景
越来越多的AI企业已经开始缩小其AI模型所针对的业务范围,并将目标具体化。例如,Appen最近参与的几个该类型的AI项目:
- 商务术语:一家公司构建了一个能对商务术语提出改进建议的AI模型,而这些商务术语之间仅有着非常细微的差异;
- 身体动作:一家公司在研究个人训练自动化模型时发现,动作轮廓会随着年纪增长而改变,需要补充老年人翻跟斗的视频并作相关标注;
- 小语种:新冠疫情的实时信息需要在全球内发布,但翻译技术并不支持所有语言,Appen开展了针对罕见语种的数据采集和标注工作,比如达里语、丁卡语及豪萨语等。
3. 从以模型为中心向以数据为中心转变
是优化代码,还是提升训练数据质量?这是过去几年间AI行业最为关注的前沿问题之一。以模型为中心的AI是指利用现有数据来构建模型,以弥补任何无关因素和不准确性,而以数据为中心的AI则重点关注数据体量和质量。目前可以看到AI行业从以模型为中心向以数据为中心转变的趋势。
4. 训练数据管理的新需求
随着市场对于训练数据需求的日益增加,为规范化管理数据训练的工作流程制定管理框架,就变得尤为重要。有效的数据管理框架应包含以下关键点:
- 用于追溯的版本控制
- 数据安全协议
- 访问控制
- 数据传输监控
- 合作协议
5. AI辅助数据标注愈发火热
自动化机器学习技术的应用日益增加,AI企业也已开始利用人工智能来辅助进行数据标注,以节省时间和降低成本。以下是数据标注自动化的3种主要类型:
- 预标注:先由AI模型对标注进行合理猜测,然后再由人工标注员进行检查和更正;
- 快速标注:利用AI功能来节省标注员的标注时间,如澳鹏Appen人工智能辅助数据标注平台的自动补全、一键贴合等功能;
- 智能验证器:AI对标注员的数据输出进行验证,如标注不在阈值范围内,则会作出提醒。
2021澳鹏Appen《人工智能与机器学习现状年度报告》要点
“高质量的数据是每一个AI项目成功实施的基础,再多的算法调整也无法抵消不良数据带来的后果。企业已经意识到,为了更快地取得更好的成果,寻求第三方高质量数据是必要的。”
--澳鹏Appen首席技术官Wilson Pang
1. 新冠疫情的影响
2020年,由于新冠疫情的影响,不同规模的企业都在加速推进AI战略,并且表示将在2021年继续保持这种势头。其中,和外部数据提供商合作的企业更容易快速发展其AI项目,成功率约为其他企业的两倍。
2. 决策负责人的转变
2021年,AI项目决策和实施的负责人中,技术人员的比例显著提升。只有39%的企业依然由高层管理人员负责AI项目,低于去年71%的比例。
3. 预算增加
AI预算金额范围从50万美元至500万美元不等,整体同比去年增长55%。其中,只有26%的企业在AI项目上的预算低于50万美元。
4. 对数据的关注
绝大多数企业已和外部训练数据提供商达成合作,对AI项目进行大规模部署和更新,而他们相比其他企业在AI部署方面取得领先的概率亦高出50%。
欲了解完整版2021澳鹏Appen《人工智能与机器学习现状年度报告》,请至澳鹏Appen官网或官微下载。
相关文章
- 全国人工智能发展大会 AI HANGZHOU 2026中国(杭州)国际人工智能展览会
- 亿达科创亮相国际人工智能展再获AI大奖
- 欢聚旗下百果园网络入选2025广州人工智能创新发展榜单
- 自主可控 智测未来|科大讯飞人工智能终端测试中心正式揭牌
- 北京国际人力获评世界品牌莫干山大会“人工智能+”生态创新实践范本
- 第九届数字中国建设峰会分论坛“人工智能产业发展和赋能新型工业化”主题交流活动在福州圆满落幕
- IBM咨询扩展人工智能能力,加速企业转型
- 点猫科技与新加坡华侨中学签署人工智能教育合作备忘录
- 许欢:人工智能应急大模型开启应急管理新发展时代
- 人工智能终端迎来“国家标尺” 联想以规模化产品实践助力标准编制
- SpaceX拟在得克萨斯州建设人工智能芯片工厂,总耗资达1190亿美元
- 微软放弃Xbox Copilot人工智能
- 人工智能助力新型工业化 第九届数字中国建设峰会工业智能产业生态大会成功举办
- 中兴通讯携手印尼XLSMART 在雅加达正式启动联合创新中心加速印尼 5G-Advanced 与人工智能发展与应用
- 马斯克出庭作证,诉讼指控OpenAI违背了打造惠及全人类的通用人工智能的核心使命
- 实力登榜!思特奇入选2026全国企业“人工智能+”行动创新案例TOP100
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源









