芯片能效提升放缓?ARM用三款IP说No
2019-10-28 18:23:21AI云资讯926
众所周知,手机市场的需求正在下降,用户的换机周期正在增长,一些评测机构也发现,各家旗舰手机的芯片在单核、多核的性能提升上也正在放缓,这是否意味着芯片的能效提升放缓?曾经表示以每年能效提升30%为目标的Arm却在上周一口气发布三款IP,向放缓说No。
从系统角度不断提升
对于每年能效提升30%来更新自身产品的目标,Arm市场营销副总裁Ian Smythe表示计算实际上分不同的层次,Arm会从系统的角度来做各种提升,不断优化整个系统内所有相关的IP。

也就是说,上周Arm推出NPU、GPU、DPU的新品实际上就是在从各个角度来为整个系统进行提升。Arm资深产品经理Sinan Yalcin就表示,如果把一些工作从GPU卸载到DPU上做,就能降低总体的系统能耗。实际上,当GPU在做一个图形处理的任务的时候,它会多次访问内存。但如果用DPU,使用专用的处理器做同样的图形处理的任务,它就会在完成任务后直接把数据发给GPU,这个时候GPU就无须再去访问内存,也就是把GPU的一些负载放到DPU上。这样一个单向的操作就能够节约能耗和带宽。
Arm公司的“工程师文化”也正是希望不断推动能效的提升,相关设计也都是从系统级别来看如何更好地降低功耗,减少芯片面积,提高效率,优化总体设计。上周发布的三款IP恰恰在能效上均有不同的提升,也为更多设备带来了更强大的AI算力、图像处理能力及显示能力,同时这一套全新的IP,设计时就考虑到解决方案,并吻合Arm全面运算(Total Compute)的初衷,以确保它们确实是实际体验驱动,同时针对解决未来工作负荷的复杂运算挑战进行优化。
性能提升200%的Ethos-N57/N37
Ethos-N57/N37,相对已经发布的定位高端设备的Ethos-N77,Ethos-N57定位主流市场,实现了性能、成本以及功耗的均衡,Ethos-N37则针对低端市场。不过,这两款产品均采用了与Ethos-N77相同的核心架构,均针对Int8与Int16数据类型的支持性进行优化,通过先进的数据管理技术以减少数据的移动与相关的耗电,同时通过如创新的Winograd技术的落地,使性能比其他NPU提升超过200%。

Arm Ethos产品组合旨在解决AI与ML复杂运算的挑战,以便为日常生活设备创造更为个性化与沉浸式的体验。由于消费者的设备越来越智能化,通过专属的ML处理器提供额外的AI性能与效率,是非常有必要的。全新的Ethos 对成本与电池寿命最为敏感的设计进行优化,NPU可以为日常生活设备带来优质的AI体验。
对于通用型NPU的优势,Arm ML事业群商业与营销副总裁Dennis Laudick透露,不少合作伙伴都向Arm表示,他们并不希望支持五花八门的处理器,他们希望硬件标准化。Arm正是首先根据生态系统里的伙伴各种各样的需求为他们提供了各种硬件、IP的选择,同时也给他们提供软件和工具的支持。
能效比提升30%的Mali-G57
Mali-G57是Arm首款针对主流市场基于Valhall架构的GPU,性能是前一代产品(Arm Mali-G52)的1.3倍。据悉,Valhall架构的两大设计宗旨为:首先,把并行的最小线程数量做得越来越大,使架构越来越宽的;其次尽量简化,从编译的角度来说做得更加的友好。

Mali-G57也同样将能效比提升30%,在性能密集度上也提升了30%,Ian Smythe表示该GPU可以以很好的画面质量来运行每秒60帧的游戏。同样,如上文所提到的通过针对同的产品系列以及产品系列内部去不断地提高GPU的ML和人工智能芯片的性能,Mali-G57可使ML性能提升60%。
Mali-G57可将优质的智能与沉浸式体验带到主流市场,包括高保真游戏、媲美电玩主机的移动设备图型效果、DTV的4K/8K用户接口,以及更为复杂的虚拟现实和增强现实的负荷。这是移动市场划分中最大的一部分,而Arm最近与Unity的发布强调其基于Arm IP的片上系统(SoC),CPU, GPU进一步的性能优化的努力,它可以让开发人员有更多的时间创造出全新的沉浸式内容。
系统电力最高可节省30%的Mali-D37
Mali-D37是首款面向主流和入门级别市场的DPU产品,最重要的特点是在支持全高清(Full HD)与2K分辨率的组态下,16纳米制程的面积小于1平方毫米。同时,通过减少GPU核心显示工作以及包括MMU-600等内存管理功能,系统电力最高可节省30%。

由于Mali-D37是一个在最小的可能面积上包含丰富显示与性能的DPU。对于终端用户而言,这意味着当面积成为首要考虑,在例如入门级智能手机、平板电脑与分辨率在2k以内的小显示屏等成本较低的设备上,会有更佳的视觉效果与性能。
于此同时,Arm还与Unity引擎进行合作,目标在自己的原生开发环境中,Unity的开发人员可以方便地访问所有Arm的性能,从而让Unity开发人员能跨Arm的CPU、GPU和NPU获得最佳性能。
相关文章
- 中昊芯英“刹那®”TPU AI芯片Day0适配智谱GLM-5
- OpenAI首次采用Cerebras的AI芯片运行Codex模型,成功实现了每秒1000次事务处理量
- 中国车市“芯”版图再扩容:本土企业稳居智能座舱芯片第一梯队
- 三星HBM4高带宽内存正式进入英伟达Vera Rubin人工智能芯片平台
- 英伟达已瞄准台积电1.6nm产能,特斯拉/微美全息加速扩展AI芯片集群生态!
- Exynos 2700芯片在Galaxy S27系列中的占比将达到50%,将对高通营收造成影响
- 浦发银行近1.6亿鲲鹏芯片服务器项目落定,神州鲲泰品牌产品中标!
- 苹果iPhone 17e或将2月19日发布,搭载M5 Pro与M5 Max芯片的MacBook Pro预计3月初亮相
- 联发科2025年第四季度智能手机芯片收入占比达59%,将通过多元化布局谋篇未来
- 云天励飞公布大算力芯片战略:目标把百万 Tokens 推理成本降低 100 倍以上
- 微软下一代Xbox游戏主机将搭载AMD开发的半定制系统级芯片,预计2027年发布
- OLED版搭载M6芯片的MacBook Pro预计将于2026年第四季度面世
- 苹果M5 Pro与M5 Max芯片将采用台积电SoIC-MH封装技术
- 苹果M6芯片或将继续采用N2制程工艺,以控制制造成本
- AI算力散热新纪元:瑞为新材以金刚石散热引领芯片热管理革命
- 鉴于散热性能问题,苹果iPhone芯片采用英特尔先进制程可能性几乎为零
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力
- 昇腾原生支持,科学多模态大模型Intern-S1-Pro正式发布并开源
- 百度千帆深度研究Agent登顶权威评测榜单DeepResearch Bench
- 在MoltBot/ClawdBot,火山方舟模型服务助力开发者畅享模型自由
- 教程 | OpenCode调用基石智算大模型,AI 编程效率翻倍
- 全国首个!上海上线规划资源AI大模型,商汤大装置让城市治理“更聪明”
- 昇思人工智能框架峰会 | 昇思MindSpore MoE模型性能优化方案,提升训练性能15%+









