出击多个细分市场,ARM多款新架构中端IP一览

秋季是收获的季节,也是“收货”的季节。无论是双十一促销,还是十月长假,都显示着这个季节,带给人们的是满足。对于...

秋季是收获的季节,也是“收货”的季节。无论是双十一促销,还是十月长假,都显示着这个季节,带给人们的是满足。对于arm这种全球首屈一指,的、以知识产权为主的公司,来说,在秋季自然也有一揽子,货物等着用户选购。10月底,ARM推出了一系列新品,包括新的中端GPU、新的ai加速架构以及,全新的显示处理模块。今天,本文就为你解读arm在这个秋季推出的,多款产品的相关信息。

arm在10月底召开了,2019年技术座谈会(ARM Tech Symposia 2019),在这个会议上,ARM发布了多款新品,包括两个AI加速核心、一个中端gpu核心,和一个显示处理模块。此外,arm还介绍了新的ai加速,品牌和相关内容。虽然从规模来看,这个发布会是一个,小范围的发布会,但是整体内容和产品信息还是,相当丰富的,值得一看。

▲ARM发布了4款新品核心,包括机器学习、中端gpu和入门级,dpu等产品。

走进移动AI加速新时代

全新的Ethos NPU

ARM在发布会上首先带来的就是新品牌“Ethos”旗下的两款新品。“Ethos”的中文意思是“气质、思潮”,arm用这个词汇来命名旗下,的ai加速架构还是挺有深意的。从产品发布时间来看,ethos相关产品架构在,2018年初就已经发布了,当时被称作“Project Trillium”或者ARM Machine Learning,简写为ARM ML。显然,这样的名称是不,可以作为商品名使用的。

▲在之前的发布会上,ARM就已经给出了有关ARM ML产品的相关信息。

2019年,arm正式发布了全新的ethos品牌和,旗下首款产品ethos N77,也就是定位于高性能的,ai加速处理器,其最高计算性能在1ghz,可达4top/s。在Ethos N77之后,arm此次在10月底,的会议上发布了ethos N57和Ethos N37两款产品,定位也变成中端和入门级,其实从数字大小和arm一贯的产品产品型型号,命名习惯就可以看出其性能是按照数字大小依次排序的。

为了增加对arm的,ethos系列产品的认识,本文简要回顾一下历史。在2018年之前,arm在机器学习上几乎没有,推出专属产品,基本上是通过不断加强gpu和cpu的性能来,提高机器学习的性能。不过随着市场发展,各大厂商都开始纷纷,定制自己的机器学习模块,包括华为、高通、imagination等厂商,都推出了有自主知识产权,的机器学习或者ai加速单元后,ARM才姗姗来迟,进入这个领域。

2018年,ARM公开发布了一个名为“Project Trillium”的开发计划,准备研发一整套用于机器学习和对象检测,的软硬件产品。此时arm也给出,了一些信息,包括性能预期和最终的,实现方法等。arm当时给出的产品预测是在,7nm工艺下,arm的机器学习处理器产品,能够在1.5w的功耗下实现,8位整数计算4.6TOP的理论吞吐量,性格功耗比大约为3TOPS/W。在集成模式和架构,实现方面,arm认为可以直接通过自家,的ace-lite接口进行接驳并,集成至soc中,当然也可以集成,在dynamiq集群中。市场方面,arm认为新的产品并不是像传统的,加速器或者模块那样使用,而是更类似一个独立,的处理器,应该被更加重视起来。

▲ARM推出了全新的机器学习产品线

总之,arm在机器学习,产品上属于“赶了个晚集”。由于推出时间较晚,因此arm还在努力向,市场推广自己的整套解决方案,包括硬件架构和,软件支持等各方面。可喜的是,在ARM发布了Ethos N77之后,人们发现arm基本实现了自己在,研发阶段的承诺,甚至还有所超越。

▲arm展示旗下机器,学习产品的框架,并宣称已经做好了,软硬件的准备。

言归正传,继续来看本次发布会的,内容。在本次发布会上,去年已经发布的Ethos n77产品又被,arm重新重点提及,当然也带来了不少的,改进内容。其中最重要的就是Ethos n77允许配置1mb到4mb,的sram缓存,而在之前的配置,中这个数据只能选择1mb。ARM解释说,客户需要更多的内存带宽来应对,网状npu的高数据(高数据)量,因为dram带宽很,有限且难以扩展。性能方面,Ethos n77和在研发阶段,的样品基本相同,都是在1ghz时种下实现4tops,的处理能力,不过性能功耗比大幅度提,升至5tops/W。

▲ARM之前给出的产品性能和功耗参数估计

另外,arm在ethos家族的架,构设计上采用了相同的构造块(CE),并且通过构造块的数量增减来实现性能,的加强或者降低。在Ethos中,所有的npu共享相同的,mac计算引擎(MCE)和可编程引擎(PLE)。MCE由128个MAC单元组成,并且和PLE配对。一个MCE和PLE,再搭配相应的sram,就组成了一个ce,这就是最基本的模块。在Ethos N77上,CE有16个,在Ethos N57上则是8个,Ethos N37则拥有4个。由于性能定位差异,arm也给出了不同,产品的用途示意。

比如最低端的Ethos N37适用于智能摄像头、入门级智能手机、数字电视机等产品。中端的Ethos N57除了包含Ethos N37的适用范围外,还可以在智慧家庭、中端手机上一显身手。定位高端的Ethos N77则包含Ethos N37和Ethos N57所有的功能,还可以额外扩展至AR/VR应用、高端智能手机、高端相机等方面。

▲ARM有关NPU产品的配置信息

功能方面,所有ethos家族产品都对功耗和,性能进行了优化(可能是性能功耗比,提升的原因之一),并且能够针对int8或者int16的数据类型进行,特殊的支持优化、还采用了数据管理技术来,减少数据移动的次数从而节约能源。在数据压缩方面,ethos家族的产品都可以采用端到,端的压缩技术,能够降低数据对dram,的要求,并且将系统带宽压力,缩减1.5~3倍。

▲arm宣称采用专用,芯片后,相比dsp的性能,提升了80倍。

除此之外,针对中低端产品,arm还带来了一些针对性,的技术手段。比如针对Ethos N57,arm对2m以内的计算,进行了性能和功耗的平衡优化。对Ethos n37这款面积小于1平方毫米,的推理处理器,arm也对其计算范围也就是,1m以内的运算进行了功耗优化。

▲ARM展示相关小数据移动至核心内部SRAM后的性能提升幅度

总的来看,本次ethos家族的进一步解读,和新品发布,使得arm在机器学习市场上拥有了,标准化的能力。正如前文所言,目前市场上机器学习相关,的ip很多,对一些客户而言,多方采购产品并最终整合在一起存在,一定的困难,且很难快速地,应对市场变化。尤其是目前机器学习相关应用,正处于高速发展的阶段,包括面部识别等生物识别和,一些图像分类算法正在不断扩大应用范围,而这些都需要机器学习,处理器的加入。ARM此时推出新的产品,不但解决了标准化的问题,还带来了小面积和,较低计算强度下的解决方案,应该会得到市场的青睐。

▲ARM Ethos家族产品的用途和场合分类

面向中端用户的新GPU

ARM Mali-G57

在本刊之前的文章中,曾经提及arm全新的,valhall架构和全新的mali-G77 GPU。新的gpu架构相比之前,的bifrost,在内核设计上有诸多改进,其整个gpu架构,设计更为现代化、更类似于桌面产品并在越来越复杂的,移动图形计算环境下有着更出色的计算能力。不过Mali-g77架构规模和最终,芯片面积都比较大,它是给高端芯片准备,的gpu架构。相应的,ARM发布了Mali-G57,利用全新架构,瞄准了中端市场。

▲ARM Mali-G57主要面向中端用户

Mali-G57和Mali-g77在配置上最大的,差异在于,Mali-g77最少需要配置7个,计算核心,而Mali-G57可以选择1~6个核心,具体的数量可以根据用户所面向的市场,以及产品定位而定。新的Mali-g57面向的市场包括,中端智能手机、4K/8K电视、VR/AR市场等。

性能方面,Mali-G57显然和Mali-G77无法相比,但是相比之前发布的定位,入门级的mali-G52,Mali-G57还是有诸多优势,比如在内容显示方面的能耗,比为mali-G52的1.3倍,在所有场合下都有,更好的峰值能耗比呈现,更好的支持VR功能,机器学习性能提升60%等。总的来看,Mali-g57是arm在中端gpu,市场的一次新尝试(新尝试),全新架构会令其带来出色,的使用体验。

▲ARM Mali-G57的性能提升情况

为中端产品带来高端功能

Mali-D37 DPU

ARM在显示处理器上也有多年的积累。之前ARM推出了新的“Komeda”显示处理器架构,并且带来了全新的Mali-D77 DPU产品。不过,这个架构在之前只面向,高端产品,中低端市场依旧只能使用,老架构。鉴于此,ARM发布了全新的Mali-D37 DPU,将新的架构和功,能带到了中低端市场中。

▲ARM Mali系列DPU发展历史简述

Mali-D37是目前面积最小、效率最高的显示处理器,产品,其在16nm工艺下的面积,小于一平方毫米,只有上代Mali-D71的36%。在节能方面,Mali-d37带来了新的内存,管理功能,被称为MMU-600,最高能够带来30%的功耗节约。对于目前比较流行的hdr,和sdr内容,之前的Mali-D71是搭配ARM Assertive Display 5 HDR管理技术,可以实现sdr和hdr的,混合显示,现在这项技术也被配备,在了mali-D37上,用户可以在更低的成本上体验到,hdr显示的魅力了。

▲新的Mali-D37 dpu相比相同程序,运行在gpu上时,性能提升大约为30%。

Mali-d37具体产品瞄准的2k和全,高清的产品,主要针对的也是中,端和入门级设备。凭借其极低的功耗,和极小的芯片面积,Mali-d37应该会成为很多,主流产品的选择。

写在最后

ARM努力将更好的体验带给用户

从本文介绍的产品可以看出,本次ARM的技术座谈会,并没有太多高端的技术和全新,的架构出现,其最主要的目的就是如何将更好的,技术和更新的架构带到更广泛的市场中去。无论是针对机器学习,的全新ethos家族,还是新的中端GPU Mali-G57,以及DPU Mali D37,都在践行着这个理念,那就是更好的特性、更便宜的价格和更,广泛的用户。

尤其值得一提的是,面向机器学习的ethos产品线,ARM在“赶了晚集”的情况下,还是依靠灵活的架构设计和自己在移动,计算领域的先天优势,迅速推出齐全的软,硬件解决方案,实现了产品的后来居上,并很有可能被广泛应用在发展速度越来越,快的智能设备中。

有关产品上市时间,比较乐观的估计,在明年年中也,就是6月左右,就应该有搭载这些技术,的产品出现在市场上了。届时本刊还将选择一些有趣的,产品进行解读,看看进入新时代、进入了机器学习时代的arm产品有哪些,更出色的体验。

0 个评论

要回复文章请先登录注册