第四范式率先发布应用持久内存技术的AI内存数据库

2019-08-12 09:35:04爱云资讯

8月2日,第四范式联合英特尔共同举办了AI实践者之声夏令营活动。活动中,针对如何通过软硬件协同优化、解决企业在应用AI过程中的算力挑战这一问题进行了探讨。第四范式机器学习系统架构师刘一鸣在“软件定义算力——打造AI转型最佳实践”的分享中介绍了第四范式&英特尔联合实验室的成果进展:在面向AI的海量数据请求、高维实时特征计算的应用场景下,基于英特尔®傲腾™数据中心级持久内存(Intel Optane DC Persistent Memory,DCPMM),实验室将不同访问频率的特征数据进行自动分级存储,在充分保证高维机器学习系统的稳定性及计算效率的同时,降低了存储成本,为企业规模化的应用AI提供了有力保障。此次合作也是国内首个将DCPMM软硬一体技术在AI内存数据库领域的应用实践。

如今,越来越多的企业意识到了AI在智能化转型过程中的重要作用,应用AI需求迫切,能否产出极致的模型效果成为企业应用AI的重要评判标准。刘一鸣提到,实现极致效果的关键在于海量数据、高维模型、实时特征三大要素。海量数据、高维模型能带来更好的AI效果,但是越复杂的特征,对计算和存储的需求也就越大,尤其是在线服务,如何在有限的资源内做到毫秒级计算至关重要。此外,数据的价值往往是随着时间的增加而递减的,尤其在决策类场景中,实时的信息更能帮助AI做出更精准的决策。以反欺诈为例,同一张信用卡一秒内连续刷卡两次,若反欺诈系统及时获取两笔交易信息,则会很容易判定其中一笔为盗刷行为,提高识别准确率,若系统未能及时获取交易信息便无法充分利用交易数据的价值。

为此,第四范式自主研发了实时特征存储引擎RTIDB。作为面向AI硬实时场景的分布式特征数据库,RTIDB具备高效计算、读写分离、高并发、高性能查询等特性,对Scan操作友好,使性能达到最大化。经测试,RTIDB性能比主流数据库快5倍。目前已广泛应用于反欺诈、反洗钱、营销、推荐等多个场景。但在实际的业务场景中,RTIDB也因传统DRAM内存在容量、成本等方面的限制,难以充分发挥其优势。

DCPMM的出现,为满足AI硬实时、低成本、高计算性能等方面提供了支持。持久内存是介于DRAM和SSD间的新存储层级,不仅能提供接近DRAM的延迟,同时还可提供持久化和更大容量的存储空间,通过RTIDB进一步释放AI存储的算力。

在存储策略方面,刘一鸣也分享了第四范式在帮助企业AI应用落地的过程中沉淀的优化方案。在大多数决策类业务场景下,数据是以表形式存在,当表数据过大时,无法将其完整的放入到传统内存中。为了实现数据的快速查询,根据机器学习数据距离越近访问频率越高的特点,RTIDB通过分级存储的方式,将秒级别的硬实时数据存放在DRAM或DCPMM中;将小时级别的软实时数据存放在SSD中;将周级别甚至更长的数据存放在硬盘中,最大化利用不同级别的存储性能,达到更优的性价比。

在线上灾备能力方面,第四范式通过更精准的数据切分和NUMA控制,保证所有DCPMM的数据访问均为延迟更低的同一Socket下的内存访问;利用Tiered Storage架构,进行冷热数据分离,使用SSD/Disk存储软实时及历史数量,进而充分利用DCPMM独有的持久化及大容量特性,将RTIDB的全量数据保存在DCPMM中,从而使不依赖Snapshot的内存数据库重启恢复成为可能。同时,使用DRAM作为热数据缓存,使得基于DCPMM优化的RTIDB不仅能获得稳定且接近于DRAM的低延迟,还可达到比以往更快的重启恢复速度。

在成本优化方面,由于部分业务场景数据量过大,以往企业必须增加节点数提高内存容量以满足业务需求,造成成本增加。采用DCPMM之后,在满足容量和性能前提下,硬件成本降低1倍。

此外,双方还基于英特尔Cascade Lake-AP处理器的全新AVX512指令集、多核心及主频利用率和CLX AP微架构IO总线的利用率进行全面优化,使得在超大规模机器学习训练场景中,基于“第四范式先知”平台软硬一体技术优化的Cascade Lake-AP处理器及平台每单位价格性能提升50%以上。

目前,基于英特尔Cascade Lake-AP处理器、傲腾™持久内存的软硬一体技术已应用在第四范式企业级AI软硬一体集成系统SageOne中,为AI训练、AI推理引和AI特征存储三大引擎提供全面支持。

第四范式副总裁郑曌在活动中表示,未来双方还将在软硬一体技术、面向AI的高性能计算等方面展开深入的合作,通过英特尔领先的软硬件产品,结合第四范式在AI领域的深厚积累以及研发优势,依托企业级的“第四范式先知”平台,加速企业规模化应用AI的进程,推动AI技术的创新和落地。

相关文章
热门文章
头条文章
重点文章
推荐文章
热点文章
关于我们|联系我们|免责声明|会展频道
冀ICP备2022007386号-1 冀公网安备 13108202000871号 爱云资讯 Copyright©2018-2023