芯片能效提升放缓?ARM用三款IP说No
2019-10-28 18:23:21AI云资讯975
众所周知,手机市场的需求正在下降,用户的换机周期正在增长,一些评测机构也发现,各家旗舰手机的芯片在单核、多核的性能提升上也正在放缓,这是否意味着芯片的能效提升放缓?曾经表示以每年能效提升30%为目标的Arm却在上周一口气发布三款IP,向放缓说No。
从系统角度不断提升
对于每年能效提升30%来更新自身产品的目标,Arm市场营销副总裁Ian Smythe表示计算实际上分不同的层次,Arm会从系统的角度来做各种提升,不断优化整个系统内所有相关的IP。

也就是说,上周Arm推出NPU、GPU、DPU的新品实际上就是在从各个角度来为整个系统进行提升。Arm资深产品经理Sinan Yalcin就表示,如果把一些工作从GPU卸载到DPU上做,就能降低总体的系统能耗。实际上,当GPU在做一个图形处理的任务的时候,它会多次访问内存。但如果用DPU,使用专用的处理器做同样的图形处理的任务,它就会在完成任务后直接把数据发给GPU,这个时候GPU就无须再去访问内存,也就是把GPU的一些负载放到DPU上。这样一个单向的操作就能够节约能耗和带宽。
Arm公司的“工程师文化”也正是希望不断推动能效的提升,相关设计也都是从系统级别来看如何更好地降低功耗,减少芯片面积,提高效率,优化总体设计。上周发布的三款IP恰恰在能效上均有不同的提升,也为更多设备带来了更强大的AI算力、图像处理能力及显示能力,同时这一套全新的IP,设计时就考虑到解决方案,并吻合Arm全面运算(Total Compute)的初衷,以确保它们确实是实际体验驱动,同时针对解决未来工作负荷的复杂运算挑战进行优化。
性能提升200%的Ethos-N57/N37
Ethos-N57/N37,相对已经发布的定位高端设备的Ethos-N77,Ethos-N57定位主流市场,实现了性能、成本以及功耗的均衡,Ethos-N37则针对低端市场。不过,这两款产品均采用了与Ethos-N77相同的核心架构,均针对Int8与Int16数据类型的支持性进行优化,通过先进的数据管理技术以减少数据的移动与相关的耗电,同时通过如创新的Winograd技术的落地,使性能比其他NPU提升超过200%。

Arm Ethos产品组合旨在解决AI与ML复杂运算的挑战,以便为日常生活设备创造更为个性化与沉浸式的体验。由于消费者的设备越来越智能化,通过专属的ML处理器提供额外的AI性能与效率,是非常有必要的。全新的Ethos 对成本与电池寿命最为敏感的设计进行优化,NPU可以为日常生活设备带来优质的AI体验。
对于通用型NPU的优势,Arm ML事业群商业与营销副总裁Dennis Laudick透露,不少合作伙伴都向Arm表示,他们并不希望支持五花八门的处理器,他们希望硬件标准化。Arm正是首先根据生态系统里的伙伴各种各样的需求为他们提供了各种硬件、IP的选择,同时也给他们提供软件和工具的支持。
能效比提升30%的Mali-G57
Mali-G57是Arm首款针对主流市场基于Valhall架构的GPU,性能是前一代产品(Arm Mali-G52)的1.3倍。据悉,Valhall架构的两大设计宗旨为:首先,把并行的最小线程数量做得越来越大,使架构越来越宽的;其次尽量简化,从编译的角度来说做得更加的友好。

Mali-G57也同样将能效比提升30%,在性能密集度上也提升了30%,Ian Smythe表示该GPU可以以很好的画面质量来运行每秒60帧的游戏。同样,如上文所提到的通过针对同的产品系列以及产品系列内部去不断地提高GPU的ML和人工智能芯片的性能,Mali-G57可使ML性能提升60%。
Mali-G57可将优质的智能与沉浸式体验带到主流市场,包括高保真游戏、媲美电玩主机的移动设备图型效果、DTV的4K/8K用户接口,以及更为复杂的虚拟现实和增强现实的负荷。这是移动市场划分中最大的一部分,而Arm最近与Unity的发布强调其基于Arm IP的片上系统(SoC),CPU, GPU进一步的性能优化的努力,它可以让开发人员有更多的时间创造出全新的沉浸式内容。
系统电力最高可节省30%的Mali-D37
Mali-D37是首款面向主流和入门级别市场的DPU产品,最重要的特点是在支持全高清(Full HD)与2K分辨率的组态下,16纳米制程的面积小于1平方毫米。同时,通过减少GPU核心显示工作以及包括MMU-600等内存管理功能,系统电力最高可节省30%。

由于Mali-D37是一个在最小的可能面积上包含丰富显示与性能的DPU。对于终端用户而言,这意味着当面积成为首要考虑,在例如入门级智能手机、平板电脑与分辨率在2k以内的小显示屏等成本较低的设备上,会有更佳的视觉效果与性能。
于此同时,Arm还与Unity引擎进行合作,目标在自己的原生开发环境中,Unity的开发人员可以方便地访问所有Arm的性能,从而让Unity开发人员能跨Arm的CPU、GPU和NPU获得最佳性能。
相关文章
- 星思半导体芯片:深耕商业航天赛道,解锁芯片企业发展新前景
- 思瑞浦 AI 数据中心全栈模拟芯片方案,构筑坚实智算根基
- 深耕核心创新技术,星思半导体推动5G RedCap芯片商业化落地
- 深耕5G/6G赛道,星思半导体彰显卫星通信芯片硬实力
- 芯启新程|亿海天剑®EQ6S7010高集成SoC芯片 全新面世
- 星思半导体以技术赋能,筑牢低轨卫星通信基带芯片品牌根基
- AI芯片散热告急!三安光电解锁先进封装“降温密码“
- 苹果的下一代MacBook和iPhone芯片或将采用英特尔的18A-P和14A工艺技术制造
- 炬芯端侧AI 音频芯片又一落地新场景,刷新无线游戏耳机体验
- 以专用量子计算定义AI——玻色量子发布新一代专用量子计算机“驭量·山海1000”及通用光量子芯片
- 跨越三大洲的“芯”路连接:南凌科技SD-WAN赋能全球芯片巨头构建研发协同网络
- 暴涨超40%!存储芯片领跑一季度工业增长,超级周期持续发酵
- 共赴「芯」征程丨科华数据携手无问芯穹,与国产芯片厂商共同打造企业级“Token工厂”一体化解决方案
- 苹果公司已达成协议,将再次使用英特尔制造的芯片
- SpaceX拟在得克萨斯州建设人工智能芯片工厂,总耗资达1190亿美元
- 纳芯微推出ASIL D芯片,高端汽车半导体国产替代加速
人工智能企业
更多>>人工智能硬件
更多>>人工智能产业
更多>>人工智能技术
更多>>- 腾讯发布CodeBuddy Security,用AI Agent实现更高效的代码审计
- Twinkle x昇腾,率先实现Deepseek-V4系列模型高效训练
- 高德发布鸿蒙首个生成式 UI 开源框架 AGenUI,告别传统 UI 开发模式
- 发布即适配| 天数智芯全力支持腾讯混元Hy3 preview 开源落地,共推国内大模型产业普惠
- Seedance 2.0面向企业公测,豆包大模型日均Token使用量突破120万亿
- 端到端OCR模型第一!百度千帆Qianfan-OCR正式发布
- 云知声Unisound U1-OCR大模型发布!首个工业级文档智能基础大模型,开启OCR 3.0时代
- 基石智算上线 MiniMax M2.5,超强编程与智能体工具调用能力









