一经发布震惊全球,看华为如何实力“碾压”高通与苹果!

2018-09-04 11:17:36爱云资讯

华为消费者业务CEO余承东在2018德国柏林消费电子展(IFA)上发表“The Ultimate Power of Mobile AI”的主题演讲,面向全球推出华为最新一代卓越人工智能手机芯片—麒麟980。

似乎已经好久没有收听到国内有哪些重大事件发生了,然而在8月的最后一天,华为似乎带着不可辜负的使命,让天朝再次成为世界的焦点!

8月31日晚八点,华为在德国IFA 2018展会上正式揭晓了新一代移动SoC处理器“麒麟980”。

一向自信的余承东直言:“基于多项技术突破和方案创新,麒麟980不仅在性能、能效、移动通信连接等方面领先业界,同时增强了AI运算力及丰富了AI应用场景,将再次引领手机全面进入智慧时代。”

不吊任何胃口,余承东直接公布了麒麟980的六个世界第一。

翻译成中文就是:

全球最早商用的台积电7nm工艺的手机SoC芯片-

全球首次实现基于ARM Cortex-A76开发的商用CPU架构,最高主频可达2.6GHz -

全球首款搭载双核NPU -

全球最新采用Mali-G76 GPU -

全球最先支持LTE Cat.21,峰值下载速率1.4Gbps,达到业内最高 -

支持全球最快LPDDR4X颗粒,主频最高可达2133MHz,同样业内最高 -

世界第一个7nm制程工艺SoC。

整个芯片尺寸仅为14mm*14mm,相比业界普遍采用的10nm制造工艺,性能可提升20%,能效提升40%,晶体管密度提升到1.6倍,实现性能与能效的双重提升。由台积电代工。

世界第一个ARM A76架构CPU

首次实现了基于Cortex-A76的开发商用,在指甲盖大小的尺寸上塞进69亿个晶体管,与上一代相比单核性能提升75%,能效提升58%。

此外,Kirin CPU子系统推出了Flex-Scheduling智能调度机制,创造性地设计了2超大核(基于Cortex-A76开发)、2大核(基于Cortex-A76开发)、4小核(Cortex-A55)的三档能效架构,提供了更为精准的调度层次,让CPU在重载、中载、轻载场景下灵活适配,让用户获得更高性能体验的同时获取更长的续航体验。

世界第一个双NPU

在双NPU的移动端算力加持下,麒麟980能做到人脸识别、物体识别、物体检测、图像分割、智能翻译等AI场景,采用更高精度的深度网络具备更佳的实时性,从而获得更优体验。麒麟980实现每分钟图像识别4500张,识别速度相比上一代提升120%。

全新一代的 NPU 设计,在 AI 性能上远超过现有其他强调 AI 的竞争产品。

世界第一个商用Mali-G76 GPU

与上一代相比性能提升46%,能效提升178%。麒麟980引入了AI调频调度技术,能够实时学习帧率、流畅度和触屏输入变化,预测手机任务负载,动态智能感知手机使用过程中存在的性能瓶颈,及时进行调频调度。

在游戏场景下,使用AI调频调度技术预测游戏每帧负载,预测准确性可以提升30%以上,有效提升了游戏平均帧率,大幅降低游戏抖动率,减少游戏卡顿,为手游用户带来操作流畅、不卡顿的优秀游戏体验。

世界第一个1.4Gbps Cat.21基带

在网络支持方面,麒麟980支持LTE Cat.21,支持业界最高的下行1.4Gbps速率。此外,麒麟980配套使用手机WiFi芯片Hi1103,率先支持160M带宽,理论峰值下载速率可达1.7Gbps,是业界同期水平的1.7倍,同时,Hi1103支持业界领先的L1+L5双频GPS精准定位,L5频段下定位精度提升10倍,有效改善手机定位精准度。

世界第一个支持LPDDR4X-2133内存

麒麟980采用的是2大核+2中核+4小核设计,配合2133MHz内存,带宽提升了20%、延迟降低了22%。

另外,在拍照能力上,麒麟980采用第四代自研ISP,像素吞吐率比上一代提升46%,能够分区域调节图像色彩与灰阶,支持更多摄像头,全新HDR色彩还原,能够分区域调节图像色彩,实现照片色彩与细节的平衡。

在演讲的最后,余承东宣布了HUAWEI Mate 20系列将于10月发布。作为首个搭载麒麟980芯片的智慧手机。

从麒麟 970 到麒麟 980,最新架构的引进大幅改进能效表现

麒麟 970 这款在 2017 下半年推出的芯片对华为而言极具有战略意义,其推动的华为产品布局与 AI 应用生态,夺走了许多消费者的眼光,也顺势推动华为的许多产品的销售。

然而,从麒麟 970 的设计理念中,还是能看出华为为了节省成本而做的努力。首先,其 CPU 架构采用 4 个Cortex-A73 搭配 4 个 Cortex-A53,是当时的主流高端架构,但是在 GPU 方面,却只采用了 12 核心的Mali G72,并通过提升运行频率以强化其性能表现。这种作法相当简单粗暴,但是对于降低芯片面积以及 IP 授权成本有一定的效果,只不过还是有些副作用出现,首先,由于频率较高,将直接挑战架构和工艺本身的功耗墙,一旦超过边界极限,那么功耗和温度就会直线上升,影响持续性能输出表现和稳定性,手机也会明显发热。

为了控制成本,麒麟芯片通常会使用少核心高频的手段来取得成本和效能的平衡,但功耗效能上的表现多少都会受到影响。为了解决这个问题,华为利用软件优化手段,也就是 GPU-Turbo 手法,针对性的瞄准特定游戏应用来优化其功耗与性能表现,的确发挥了不错的效果,就连高通也希望仿效这种作法来改善其硬件的表现,对业界整体而言,华为的确带起了一波技术革新与示范作用。

而麒麟 970 的另一个重点在于全球首发的 AI 硬件 NPU 设计,其AI算力很强,可以在 1W 功耗下达到4TOPS 的性能表现,不止相关应用的性能与效果超出高通的异构计算,甚至苹果 NPU 也自叹不如,而其他的“纯软件模拟 AI 方案”就更不用说了。

而此次在 IFA 大会上发布的麒麟980,采用的是 Cortex-A76。Cortex-A76 是在今年 6 月才发布,官标的数据方面,基于台积电 7nm 工艺的 3GHz A76 核心比 10nm 2.8GHz 的 A75 核心性能提升 35%、省电40%、机器学习的负载能力提升 4 倍。

在 GeekBench 4 跑分方面,整数和浮点相较于 A73 提升了 90% 和 150%,最终得分提升 35%。

A76 同样支持 DynamIQ 拓扑特性,官方建议 1+7/2+6 这样的 Big.little 大小核设计。通过使用最新核心,麒麟 980 的性能表现也达到惊人的程度,另外在 GPU 部分,同样也采用了最新的 Mali-G76,其性能密度提升了 30%,节电 30%,用于手机的图形性能会提高 50%,现在可以支持最高 8K 分辨率的屏幕了。不过由于成本考虑,虽然核心数量只有 10 个,较麒麟 970 少了 2 个,但性能是相当于 20 个旧版核心。

但值得注意的是,由于必须考虑到成本架构,华为在麒麟 980 的架构设计上依然还是偏重成本控制,所以除了使用最新架构外,核心数量或者是自定核心并没有太过积极的动作,因此,在同业对手的方案相继跟上 7nm 脚步后,华为要面对的竞争态势也将会有所改变。

不过在重点的 AI 单元,华为将继续使用专用 NPU 的方案,并使用了双核配置,性能达前代方案的 135%。而且其设计原生为 7nm 工艺优化,更能适合麒麟 980 的设计方向,而这点也将成为麒麟 980 能否领导未来手机 AI 方案的重要关键。

其他 AI 手机方案竞争者

即将引入硬件 NPU 的高通

作为全球最大的手机方案供应商,高通过去通过 Hexagon 与 GPU、CPU 协同工作,达成对主流AI 框架的计算加速能力,虽然在效率上还是明显落后苹果与华为的硬件方案,但总是给市场一个交代。


然而,异构计算(Heterogeneous computing)虽然弹性高,且可以有效利用芯片中的不同类型计算架构,但目前 AI 计算方案讲求的是更高的能效表现,而在手机等移动终端上,更显重要,虽然高通的异构计算已经属于相当高效的技术,但仍与 ASIC 有一定的落差,也因此,在使用针对 AI 加速框架进行性能的评比应用时,高通很明显要落后采用硬件 NPU 的竞争对手,未来如果 AI 模型往更复杂的方向发展,或者是同时需要执行多种 AI 服务,那么在发展空间上就可能会明显不如竞争对手了。

(来源:高通官网)

不过,高通也不是不知应变,根据市场传闻,其在下一代中高端方案骁龙 700 系列中,将引入硬件 NPU 设计,而如果成真,其下一代高端方案,也就是骁龙 855,也将可能沿用同样的方式。

而目前高通也引进了包含商汤等多家 AI 算法设计公司所设计出来的应用框架,想要快速冲刺相关市场,不过高通目前的 AI 性能还有相当大的改善空间,如果要负载更复杂、多元的 AI 计算,恐怕还是要等到下一世代的 AI 设计问世。而根据 DT 君得到的信息,高通将在 12 月正式发布新一代的高端 AI 手机方案,按照往例,明年初就可以见到实际终端产品。

三星从抄袭到走出自己的路,Exynos的半软半硬 AI 亦然

三星作为全球最大的手机厂商,其势力涵盖终端、消费、云端服务、半导体制造与设计等领域,而其中,手机市场是其最重视的一块,而为了推动其手机市场的布局,三星过去亦步亦趋的追随包含苹果与高通的步伐,并将学习到的设计精髓转化为自有的方案设计。

目前三星主要的芯片来源包含了自行设计的 Exynos 系列、高通的骁龙系列、联发科的低端 MT 系列,以及展讯的 SC 系列,市场从最高端,到最低等级,可能会被我们直接当作电子垃圾的产品,几乎都有覆盖。

目前 Exynos 9810 是三星的主力自产高端产品,今年的 Galaxy S9 系列、Note9 系列都可见到其身影,其采用的 AI 计算方式与高通类似,主要是通过 DSP、GPU 与 CPU 的协同计算,不过三星有个特殊的作法,那就是视觉相关的处理交由硬件,而非异构计算。

目前的 9810 采用脱胎自 Cortex-A75 的 M3 定制架构,并搭配 Cortex-A55 作为小核心,而与华为最大的不同是,三星在 GPU 规模上相当舍得下工本,其 Mali-G72 核心数量配置高达 18 个,比麒麟 970 多出 6 个,虽然芯片成本会较高,但可以在较低的时钟水频达到更稳定、更好的效能表现,换言之,能效也更好。

(来源:三星官网)

而 9810 中有个 VPU 计算单元,顾名思义,是用来处理视觉方面的计算工作,这个单元应该是硬件设计,但只能用来处理比较固定的功能,三星也未公开发布任何支持该计算单元的可编程或开发套件框架。

而其他的 AI 计算工作就如高通般,是使用异构计算,统 GPU 与 CPU 来达成,这方面可能主要是沿用 Arm 的软件资源,三星也同样没有发布任何相关的开发套件给第三方开发者。

而下一代方案,也就是 Exynos 9820,将会采用 ARM DynamIQ 架构设计,并且将以“2+2+4”三丛集形式打造,其中两组大核将采用三星第四代自主架构“M4”,第二道两组大核则以 ARM Cortex-A75 构成 (也可能以 Cortex-A76 取代),而小核部分则将以 4 组 ARM Cortex-A55 构成。

AI 部分则将可能维持 9810 的作法,那就是采用 VPU 硬件处理单元来处理部分视觉计算工作,并搭配既有的异构计算方式来处理标准 AI 计算框架,也就是半软半硬的方式。

最后,9810 采用的是三星 10nm工艺,而 9820 将可能是三星 7nm 方案首发,但因为三星的 7nm 采用 EUV 技术,目前还在调试中,真正量产最快也要今年底或明年初,这也可能让 9820 成为最晚推出的次世代 AI手机芯片方案。

赚走最多钱的手机公司搞 AI——苹果

苹果基本的手机芯片布局是每年一款,当然,为了配合如平板电脑或者是手表等其他终端的产品时程,也会在不特定的时间点发布相关方案。而苹果最新的手机芯片是去年发表的 A11 Bionic,内建的硬件 NPU 是最大特色。而苹果在其芯片中往往都使用较少的核心,相较对手都已经走到 8 核以上,苹果 A11 还只是个 6核产品,但其表现出来的性能数据却远远超越所有竞争对手,其原因包括苹果对其使用的 Arm 架构深度定制化,并舍得为了特定性能目的来堆加更多晶体管,因此其芯片制造成本往往也都比同时期的手机芯片方案更高。但此策略成功推动手机的销售,并创造更高的获利,因此每一代方案苹果也就更舍得堆料,形成正向发展。

(来源:苹果官网)

A11 使用的是台积电 10nm 工艺,这也是少数几次没有使用到三星代工工艺的苹果芯片,由于目前苹果的开发套件中,只开放 GPU 计算能力给开发者,而 GPU 也负担包括第三方 AI 应用的训练或推理的工作,对苹果而言,GPU 的份量也越来越重要,这也是之所以苹果要推动自有 GPU 架构的发展。

虽然目前所采用的 PowerVR 架构在性能与菜单现上相当出色,该公司也愿意配合苹果进行高度定制工作,但这对于苹果而言仍远远不足,而展望未来苹果对其 GPU 架构的布局,将可能是个结合绘图、计算以及推理、训练的全功能 AI 优化设计,当然,为了能耗表现,推理工作可能还是维持独立的 NPU 单元来进行。

而未来 A12 将会如何?其实在现阶段也只能猜测,唯一能确定的只有使用 7nm 制造工艺这点。而在架构方面,根据过去的惯例,性能的增长肯定是不能忽略的,毕竟对手也都在积极追赶,今年对手的主流方案都已经在整体性能上有相当大的改善,也拉近了与 A11 的距离,A12 肯定会在CPU 与 GPU 方面进行更深度的改造,不论是增加更多的处理管线,更优化 CPU 或 GPU 内部的流水线设计,亦或者粗暴的堆加核心,都是可能的作法。

至于在关键的 AI 硬件单元方面,除了强化效率以外,也可能就规模方面进行扩展,借以压制华为或高通等即将面世的下一代 AI 方案。

专注中低端的联发科

联发科 2018 年主打的 AI 手机方案 P60,具备 AI 专用计算模块的APU(AI specialized Processing Unit),基于 DSP 计算架构,而 CPU 则是采用Cortex-A73 搭配 Cortex-A53 的四大四小设计,虽然不是采用最新的 Cortex-A76,但性能表现仍有一定水准,GPU 方案则是使用 Mali-G72 这款相当稳定的 GPU 架构,不过可惜的是,联发科为了成本考虑,只采用 MP3 配置,并以高频率运作来补足性能表现,因此在运行游戏时,可能会对电池寿命产生负面影响。目前 P60 已经被应用在包含 OPPO 等多款手机产品当中,虽后的小改版产品也已经箭在弦上。

(来源:联发科官网)

目前,中国前几大手机厂商都是联发科的客户,产品多分布在中低端,包含华为、OPPO、VIVO、小米、魅族,以及其他二三线厂商,基本上都摆脱不了联发科,毕竟中低端手机中具备成本优势,产品线完整且技术更新还能跟上市场脚步,且能提供最好技术支持服务的,就属联发科了。而在前两年,联发科也打入三星的供应炼,通过使用一定比重的三星芯片代工工艺服务,三星也在其低端手机中采用联发科的方案作为交换。

联发科的方案成本相对较低,且过去在包裹 TurnKey 服务方面口碑极好,在中国的支持人力也最广泛,虽然是 AI 生态的后进者,但是在商汤等 AI 大公司的协助之下,或许第一时间就能够提出够成熟的语音与视觉 AI 方案,对客户而言,联发科一直都是便宜又大碗的选择。

对于HUAWEI Mate 20系列将会搭载980芯片你怎么看?又讲会给广大用户带来怎样的性能体验呢?

相关文章
热门文章
头条文章
重点文章
推荐文章
热点文章
关于我们|联系我们|免责声明|会展频道
冀ICP备2022007386号-1 冀公网安备 13108202000871号 爱云资讯 Copyright©2018-2023