华为携手景联文科技发布面向AI数据湖的数据工程联合解决方案
2025-03-25 11:36:13AI云资讯11838
近日,在2025年华为中国合作伙伴大会上,华为携手景联文科技发布面向AI数据湖的数据工程联合解决方案。该方案基于端到端高效、可靠、共享、易管理的AI数据湖,旨在将海量多模态数据资源高效转化成高质量AI算料,为行业智能升级注入充沛的数据动能。

景联文科技CEO刘云涛
“AI-ready的前提是Data-ready,大模型的好坏取决于数据的好坏。高质量数据集的供给是AI行业化落地的关键要素,也是促进数据要素繁荣交易的根基。”景联文科技CEO刘云涛强调,“精准全面的数据治理能力,结合可靠高效的数据基础设施,在智能化升级中不可或缺。”
普遍来说,面向AI的数据需要经历三大环节,即:从海量原始数据提炼为结构化数据集,然后经标注成为语料集,最终构成知识库、支撑模型训练及业务应用。在这个过程中,当下正面临多重挑战:
●首先,数据拥有方动力不足:大部分数据持有者缺少便捷安全的数据汇聚托管系统,普遍陷入“不愿、不敢、不会”的困境,数据共享壁垒高筑。
●其次,语料开发难:原始数据种类多、格式杂、时效高,如文本、图像、音视频等多模态原始数据,增加了语料处理的复杂性。同时,行业专用语料往往包含大量特有的垂类知识、表达方式,加剧了精准标注的难度。
●最后,数据可信流动难:数据作为风险资源,如果在流通中缺少端到端安全管控,则易遭受被篡改、被扩散的风险。此外,区域间数据基础设施发展程度不均,且兼容性和互操作性不足,导致数据跨域流通效率低下。
景联文科技与华为强强联合,依托景联文科技深耕多年的数据工程能力、以及华为数据存储行业领先的技术优势,推出面向AI数据湖的数据工程联合解决方案:
●全流程数据工程:景联文科技Solar Data平台采用AI Agent理念,与全闪数据湖存储紧密协同,支持异构数据的高效加工,实现对30+格式的自动或半自动化清洗、解析、预处理、特征提取与初步分析,并基于AI预标注与专业手工标注结合,最终整合为高质量的数据产品,全流程效率提升70%。
●数据流通与资源调度:通过华为DME(Omni-Dataverse)全局文件系统,结合可信数据空间,实现多源数据无缝归集,让全局数据可视、可管、可流,保障数据交换过程的可信、可证、可控。基于华为DCS的统一资源调度,实现Solar Data平台计算、存储、网络等资源的弹性服务与统一管理。并通过ModelEngine AI使能工具链框架,实现高效模型编排与应用对接,加速数据集开发进程。
●先进数据底座:基于华为OceanStor Pacific分布式存储底座建设统一数据底座,在先进介质、协议互通、负载优化、分布式并行客户端等领域软硬协同创新,打造业界领先的高密绿色数据基础设施,助力海量数据更持久地存储、更高效地访问。

华为数据存储将持续深化与业界伙伴的合作,携手促进AI时代应用生态的蓬勃壮大,秉持“以数据为中心”的产业理念,发挥数据在数字经济的核心驱动力作用。
相关文章
- 光智共融:上海交通大学医学院联合华为打造AI F5G-A全光校园全球样板
- 华为音乐联合太校园音乐节燃动西交大,解锁鸿蒙创新玩法
- 赋能小微智赢未来,华为坤灵中国行2026·山东站成功举办
- 招投标垂直AI软件「云境标书AI」荣获华为鲲鹏双项技术认证
- 华为浏览器2026高考频道上线,小艺AI深度赋能,科学伴考全周期
- 鸿蒙版360浏览器上线AI创作!华为Pura X Max新机入手即开启高效办公
- 湖北电信携手华为率先打造5G-AxAI大上行网络,赋能Mobile AI新时代
- 华为推出iNCR原子基站 机身仅手掌大小
- 推动商业网络领域高质量发展 华为2026星河AI网络商业峰会在深圳成功举办
- 中国联通在北京地区携手华为发布3000M宽带新产品,全光臻宽带矩阵为“双万兆AI提质行动”添砖加瓦
- 服务再升级,中国联通携华为在云南发布2000M智慧产品
- 华为iNCR原子基站点亮小微场景,湖北移动守护荆楚“烟火气”
- 华为超千兆新品亮相山西!三频Wi-Fi 7+AI 焕新智慧家庭新生活
- 辽宁与华为联合发布超千兆三频Wi-Fi 7+AI 新品,共筑辽沈智慧家庭新生活
- 华为云创想者大会主题论坛议程公布:释放Agentic AI新布局
- 华为云创想者大会主题论坛议程公布:释放Agentic AI新布局
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源









