芯片能效提升放缓？ARM用三款IP说No-AI云资讯

众所周知，手机市场的需求正在下降，用户的换机周期正在增长，一些评测机构也发现，各家旗舰手机的芯片在单核、多核的性能提升上也正在放缓，这是否意味着芯片的能效提升放缓？曾经表示以每年能效提升30%为目标的Arm却在上周一口气发布三款IP，向放缓说No。

从系统角度不断提升

对于每年能效提升30%来更新自身产品的目标，Arm市场营销副总裁Ian Smythe表示计算实际上分不同的层次，Arm会从系统的角度来做各种提升，不断优化整个系统内所有相关的IP。

也就是说，上周Arm推出NPU、GPU、DPU的新品实际上就是在从各个角度来为整个系统进行提升。Arm资深产品经理Sinan Yalcin就表示，如果把一些工作从GPU卸载到DPU上做，就能降低总体的系统能耗。实际上，当GPU在做一个图形处理的任务的时候，它会多次访问内存。但如果用DPU，使用专用的处理器做同样的图形处理的任务，它就会在完成任务后直接把数据发给GPU，这个时候GPU就无须再去访问内存，也就是把GPU的一些负载放到DPU上。这样一个单向的操作就能够节约能耗和带宽。

Arm公司的“工程师文化”也正是希望不断推动能效的提升，相关设计也都是从系统级别来看如何更好地降低功耗，减少芯片面积，提高效率，优化总体设计。上周发布的三款IP恰恰在能效上均有不同的提升，也为更多设备带来了更强大的AI算力、图像处理能力及显示能力，同时这一套全新的IP，设计时就考虑到解决方案，并吻合Arm全面运算(Total Compute)的初衷，以确保它们确实是实际体验驱动，同时针对解决未来工作负荷的复杂运算挑战进行优化。

性能提升200%的Ethos-N57/N37

Ethos-N57/N37，相对已经发布的定位高端设备的Ethos-N77，Ethos-N57定位主流市场，实现了性能、成本以及功耗的均衡，Ethos-N37则针对低端市场。不过，这两款产品均采用了与Ethos-N77相同的核心架构，均针对Int8与Int16数据类型的支持性进行优化，通过先进的数据管理技术以减少数据的移动与相关的耗电，同时通过如创新的Winograd技术的落地，使性能比其他NPU提升超过200%。

Arm Ethos产品组合旨在解决AI与ML复杂运算的挑战，以便为日常生活设备创造更为个性化与沉浸式的体验。由于消费者的设备越来越智能化，通过专属的ML处理器提供额外的AI性能与效率，是非常有必要的。全新的Ethos 对成本与电池寿命最为敏感的设计进行优化，NPU可以为日常生活设备带来优质的AI体验。

对于通用型NPU的优势，Arm ML事业群商业与营销副总裁Dennis Laudick透露，不少合作伙伴都向Arm表示，他们并不希望支持五花八门的处理器，他们希望硬件标准化。Arm正是首先根据生态系统里的伙伴各种各样的需求为他们提供了各种硬件、IP的选择，同时也给他们提供软件和工具的支持。

能效比提升30%的Mali-G57

Mali-G57是Arm首款针对主流市场基于Valhall架构的GPU，性能是前一代产品（Arm Mali-G52）的1.3倍。据悉，Valhall架构的两大设计宗旨为：首先，把并行的最小线程数量做得越来越大，使架构越来越宽的；其次尽量简化，从编译的角度来说做得更加的友好。

Mali-G57也同样将能效比提升30%，在性能密集度上也提升了30%，Ian Smythe表示该GPU可以以很好的画面质量来运行每秒60帧的游戏。同样，如上文所提到的通过针对同的产品系列以及产品系列内部去不断地提高GPU的ML和人工智能芯片的性能，Mali-G57可使ML性能提升60%。

Mali-G57可将优质的智能与沉浸式体验带到主流市场，包括高保真游戏、媲美电玩主机的移动设备图型效果、DTV的4K/8K用户接口，以及更为复杂的虚拟现实和增强现实的负荷。这是移动市场划分中最大的一部分，而Arm最近与Unity的发布强调其基于Arm IP的片上系统(SoC)，CPU， GPU进一步的性能优化的努力，它可以让开发人员有更多的时间创造出全新的沉浸式内容。

系统电力最高可节省30%的Mali-D37

Mali-D37是首款面向主流和入门级别市场的DPU产品，最重要的特点是在支持全高清（Full HD）与2K分辨率的组态下，16纳米制程的面积小于1平方毫米。同时，通过减少GPU核心显示工作以及包括MMU-600等内存管理功能，系统电力最高可节省30%。

由于Mali-D37是一个在最小的可能面积上包含丰富显示与性能的DPU。对于终端用户而言，这意味着当面积成为首要考虑，在例如入门级智能手机、平板电脑与分辨率在2k以内的小显示屏等成本较低的设备上，会有更佳的视觉效果与性能。

于此同时，Arm还与Unity引擎进行合作，目标在自己的原生开发环境中，Unity的开发人员可以方便地访问所有Arm的性能，从而让Unity开发人员能跨Arm的CPU、GPU和NPU获得最佳性能。

芯片能效提升放缓？ARM用三款IP说No

相关文章

AI企业

AI硬件

AI产业

AI技术