论文部分内容阅读
在CES 2019上,高通最大的重头戏之一,就是宣布推出第三代Qualcomm骁龙汽车数字座舱平台(Qualcomm SnapdragonAutomotive Cockpit Platforms),新一代平台包括三个全新层级:面向入门级的Performance系列、面向中端的Premiere系列和超级计算平台Paramount系列。
全新的第三代Qualcomm骁龙汽车数字座舱平台是基于骁龙820A平台的升级。也许有人会说,2019都已经是骁龙855时代了,怎么还在说骁龙820?请注意,这个820后边可是帶了一个A的,这意味着这枚芯片组是按照车规级标准定制的。由于使用在汽车上,所以在能耗、散热、PCD板布置等方面,都远比手机上来得轻松,所以骁龙820A的性能可以在汽车上得到最大效率的发挥,已经使用过的软硬件厂商对于这一平台都是高度好评。而到了全新这一代,高通更是加载了豪华的异构计算阵列:集成多核Qualcomm人工智能引擎Al Engine、QualcommSpectra ISP、第四代Qualcomm Kryo CPU、Qualcomm Hexagon处理器和第六代Qualcomm Adreno视觉子系统。
骁龙汽车数字座舱平台的参考设计模块
正是因为没有了散热与功耗控制上的担忧,第三代Qualcomm骁龙汽车数字座舱平台的GPU足以提供驱动总像素值高达3200万的多块屏幕(之前的骁龙820A可以驱动6块1080P分辨屏的屏幕),如此一来,它不仅仅可以照顾传统汽车的仪表台,中控,车内后视镜等处的显示屏,更可以连带驱动两块车外后视镜,而且这些屏幕,全部都可以拥有非常出色的像素点阵,视觉效果出众。其无论是对于汽车的驾驶体验,还是娱乐氛围,都能带来完全不同于以往的体验。
除了由骁龙处理器驱动的汽车数字座舱平台,本次CES大展上更令人印象深刻的,还有骁龙平台所集成的C-V2X功能一一奥迪、福特和杜卡迪都在本次展会上宣布将在2022年推出搭载这一功能的汽车产品。C-V2X功能到底有什么用呢?在我们参与了高通在拉斯维加斯搭建的C-V2×体验之后,不禁让我们啧啧称奇。搭载这一移动通信模块的汽车,就像彼此之间有了沟通能力一样,它们会通过无线网络,互相传递彼此的位置信息,要是在遇上视觉盲区这些地方,在汽车仪表台的显示屏上,会马上给出提示,让驾驶者减速避让。
车与车之间的沟通还关乎进行方向,这样驾驶者在路口就能提前得知对面来车的走向是否会影响自己的行进路线,从而减少不必然的让行等待时间,从而大幅度地提升通行效率。这一点可能在国内的车主感触不太深,而在让行文化比较盛行的欧美,这样的功能的确是非常有用的。不仅如此,C-V2X功能还能让车与其附近的信号灯形成互动,可以让车主知道自己是否能按当前速度顺利通过下一个绿灯,还能提醒前方是否有行人等信息,以便提前做出判断与操作。
体验完C-V2×功能之后,我们一度认为其会与自动驾驶功能进行结合,但是高通负责汽车芯片业务的Patrick Little告诉我们,在L1、2、3级别的自动驾驶当中,暂时还用不到C-V2X的联网功能,但是最高级别的L4、5级自动驾驶,却会在这项功能当中受益良多。随着车联网能力,特别是5G的到来,超低时延的网络接入,会为L4、5级自动驾驶带来更多且更有效互动信息。
写在最后
第三代Qualcomm骁龙汽车数字座舱平台的推出,不仅意味着高通将会在未来加大在汽车芯片领域的投入,意味着它将会把在智能手机领域积累的合作经验,移植到汽车领域的客户身上,届时我们将会看到更多类似于智能手机的人性化体验出现在的汽车座舱之中,而这恰恰是过往汽车厂商的短板,特别是进入5G时代之后,移动处理器平台与汽车之间还会有什么样的结合,将是令人期待的。疾如电,稳如山高通年度旗舰SoC骁龙855基准测试记
骁龙汽车数字座舱平台的参考设计模块
CES 2019期间,高通在美国茂宜岛新发布的高通年度旗舰SoC骁龙855的基准测试。本年度的跑分活动依旧是由QualcommTechnologies产品管理高级总监Travis Lanier主持。和去年一年,Travis还是首先表明了高通对于跑分测试的态度,即大家所推崇的跑分,只能测试到一块SoC整体很少的一部分能力,主要是CPU、GPU以及内存等,但是,这些基准测试并不能衡量芯片上的大部分功能。因此,分数固然是重要的,但是同时高通也希望大家在拿到这些终端之后,也可以关注这款终端所带来的体验,以及这些体验是如何实现的。游戏、XR、性能、功效、音频、图像品质和Al等表现是无法通过基准测试来衡量出来的。
但是,不管高通的工程师心中怎么“委屈”,但是CPU、GPU的能力,毕竟还是现在大家感受最直观的部分,也是用来衡量一块SoC基本身体素质的要素,因此也不得不跑。所以,Travis叉再次强调了全新骁龙855在这方面的能力:比如最新的Adren0 640,除了能图形渲染能力提升20%之外,更是具备业界领先的能耗比,同时也是业界第一款在手机上支持Vulkan l.1的GPU。
而CPU方面,则算是今年骁龙855最大的变化之一。Kry0 485从过往的4 4的大小核两级布局,升级为4 3 1的三级布局,其中最强悍的就是主频高达2.9GHz的A76架构超级内核(Prime Core)。它的加入,主要就是为了解决高通SoC传统的AP(应用处理)能力相比竞争对手不太强的问题。也正因为这个核心的加入,让骁龙855的CPU性能比起上一代提升了高达45%-不过这个趋势,在之前香港4G/5G峰会上亮相的骁龙675就已经体现出来了,只不过没想到高通会提升得这么猛。对此Travis说,这相当于在骁龙845 CPU性能的基础上,足足加入了一整个骁龙820的CPU性能。
但是,高通在大幅度提升CPU和GPU能力的同时,还没有忘记重要的一点,就是SoC的长时间大负荷工作下稳定的性能输出。对此Travis说,我们对两家7纳米制程竟品处理器(是谁大家很清楚吧)进行了常见的游戏基准测试,可以看到其中一家7纳米竞品一开始表现良好,但是在5分钟之后,游戏性能下降明显。相信大多数用户在玩游戏时,时长都会超过5分钟,所以在评测真正的游戏性能时,这个测试方法更有意义。而对于另一家竟品的游戏表现,看起来它还有很长的路要走。在游戏开始之后,7纳米制程的竞品处理器与我们10纳米制程骁龙845的游戏性能相当。这话说出来,在场的人都笑了,高通工程师这次对骁龙855真是信心爆棚,结果怎么样,后续跑分结果自会说明。 最后说到的,就是刚刚兴起的Al跑分,其实这也是这次骁龙855变化很大的部分。新加入的Hexagon 690 DPS,标量性能提升了20%,向量处理器内核从两个变为4个,而张量加速器是全新加入的。说到这里,高通SoC是否有独立NPU的问题又屡次被问起,其实早在之前参加骁龙峰会的时候,我就已经做过解释,但更有意思的并不是这个。在CES 2019开展之后,我们又采访了Qualcomm Technologies产品管理高级副总裁Keith Kressin,他主要负责的开发工作,就是骁龙SoC的性能部分。之前的茂宜岛,他被问到NPU问题的时候,还笑称:“只要能卖得好,你们爱怎么叫怎么叫!”
一个月以后,他的回答已经变了:“我想澄清—下Qualcomm骁龙855上的Al架构。骁龙855上有传统的DSP,在这个传统的DSP上因为有向量扩展所以它可以处理向量,同时传统的DSP也可以处理标量;在855上一共有4个向量内核。但同时要强调的一点是,在骁龙855上,我们还新增了独立的处理模块,它是一个独立的芯片硬件,我们称之为Hexagon张量加速器HTA(Hexagon Tensor Accelerator)。因此,我们有传统的Hexagon DSP,此外,我们新增了一个张量加速器一一在业界可能会被称之为NPU、DLA、神经网络引擎等等,但在Qualcomm,我们管它叫做Hexagon张量加速器HTA。Qualcomm将上述所有称之为Hexagon,因此,我们不仅仅是扩展了DSP的功能,而是实实在在的新增了一个独立的模块,只是从品牌角度.我们将它划分到Hexagon这个品牌名称下。因此,Hexagon张量加速器HTA是一个独立的物理实体芯片模块。从软件角度,在Hexagon里是协同工作的,比如一个程序员只需把一个Al算法发给Hexagon,Hexagon就会智能地分配哪些用张量加速器HTA处理,哪些让传统的DSP来处理。因此,它们在软件上是有关联的,但是它们采用的是不同架构、不同的设计,仅仅是都划分到Hexagon这个品牌名称下。”
Gary Brotman是负责骁龙SoC Al研发的工程师,他首先说明了骁龍855 Al运算硬件的提升情况:“与骁龙845相比,Adren0 640增加了50%的算数逻辑单元(ALU),同时我们也面向全精度和半精度网络进行了优化。另外,我们在Hexagon 690上增加了一个专门只针对Al处理的张量加速器,并且将向量扩展内核的数量从骁龙845上的2个增加到了现在的4个,同时也优化了标量处理和语音助理。最后,我们在Kry0 485上新增了对全新的点积指令的支持,比如在INT8网络下可以实现4倍的Al性能提升。”
但是众所周知,Al的运算,除了硬件能力之后,算法也同样重要,对此Gary也做了说明:“所以除了硬件内核之外,我们还有针对不同内核处理的库,包括针对CPU的Qualcomm Math Libraries、针对GPU的Open CL和针对Hexagon的Hexagon NN。此外,在运行软件框架方面,骁龙855不仅支持第一代Qualcomm人工智能引擎Al Engine上推出的神经处理SDK,用来发挥SoC异构计算的能力,并且还在Android O上加入了对Google NN API的支持,在Android P上新增对更多算子(operator)的支持,最后还有对TensorFlow Lite的支持。除了这些之外,我们还加入了对更多神经网络框架的支持,以便让开发者在编程时有更高的灵活性。”在这里有一个很让我印象深刻的小事情了。之前在2018年2月的MWC上,我特别问了Gary骁龙845的第三代Al Engine的卷积运算层数,当时得到的答案是120层,这次我也问了同样的问题,但是Gary没有第一时间答复,而是说:“我回去查—下答复你,但是很重要的一点,是算法升级,这方面的运算能力会有很大的不同。”几天后在高通安排的欢迎晚宴上,Gary特别拦住了我,说“你要的答案我有了。”然后他翻了翻手机,给我看了一个数字(然后他特别嘱咐我这个数字你可以知道但不要对外说)。从数字上看,骁龙855所搭载的第四代Al Engine卷积运算层数已经比上代提升了5倍不只,除了硬件性能的帮助之外,算法的提升帮助更大……-
写在最后
从整个得分来看,骁龙855已经足够可以称得是当前综合性能最强的旗舰级SoC了一一也难怪后边在采访Keith的时候,他的心情是如此之好。不过,作为商业化的芯片公司,高通面临的不仅仅是要推出性能强劲的SoC,更重要的还有如何能帮助OEM合作伙伴,能更多的采用这块旗舰SoC。不过好消息是,今年好像各家厂商对于骁龙855的态度,都比前代产品更积极,这对于涉及其中的所有人,包括高通、OEM厂商、还有消费者,应该都是好事情吧!
全新的第三代Qualcomm骁龙汽车数字座舱平台是基于骁龙820A平台的升级。也许有人会说,2019都已经是骁龙855时代了,怎么还在说骁龙820?请注意,这个820后边可是帶了一个A的,这意味着这枚芯片组是按照车规级标准定制的。由于使用在汽车上,所以在能耗、散热、PCD板布置等方面,都远比手机上来得轻松,所以骁龙820A的性能可以在汽车上得到最大效率的发挥,已经使用过的软硬件厂商对于这一平台都是高度好评。而到了全新这一代,高通更是加载了豪华的异构计算阵列:集成多核Qualcomm人工智能引擎Al Engine、QualcommSpectra ISP、第四代Qualcomm Kryo CPU、Qualcomm Hexagon处理器和第六代Qualcomm Adreno视觉子系统。
骁龙汽车数字座舱平台的参考设计模块
正是因为没有了散热与功耗控制上的担忧,第三代Qualcomm骁龙汽车数字座舱平台的GPU足以提供驱动总像素值高达3200万的多块屏幕(之前的骁龙820A可以驱动6块1080P分辨屏的屏幕),如此一来,它不仅仅可以照顾传统汽车的仪表台,中控,车内后视镜等处的显示屏,更可以连带驱动两块车外后视镜,而且这些屏幕,全部都可以拥有非常出色的像素点阵,视觉效果出众。其无论是对于汽车的驾驶体验,还是娱乐氛围,都能带来完全不同于以往的体验。
除了由骁龙处理器驱动的汽车数字座舱平台,本次CES大展上更令人印象深刻的,还有骁龙平台所集成的C-V2X功能一一奥迪、福特和杜卡迪都在本次展会上宣布将在2022年推出搭载这一功能的汽车产品。C-V2X功能到底有什么用呢?在我们参与了高通在拉斯维加斯搭建的C-V2×体验之后,不禁让我们啧啧称奇。搭载这一移动通信模块的汽车,就像彼此之间有了沟通能力一样,它们会通过无线网络,互相传递彼此的位置信息,要是在遇上视觉盲区这些地方,在汽车仪表台的显示屏上,会马上给出提示,让驾驶者减速避让。
车与车之间的沟通还关乎进行方向,这样驾驶者在路口就能提前得知对面来车的走向是否会影响自己的行进路线,从而减少不必然的让行等待时间,从而大幅度地提升通行效率。这一点可能在国内的车主感触不太深,而在让行文化比较盛行的欧美,这样的功能的确是非常有用的。不仅如此,C-V2X功能还能让车与其附近的信号灯形成互动,可以让车主知道自己是否能按当前速度顺利通过下一个绿灯,还能提醒前方是否有行人等信息,以便提前做出判断与操作。
体验完C-V2×功能之后,我们一度认为其会与自动驾驶功能进行结合,但是高通负责汽车芯片业务的Patrick Little告诉我们,在L1、2、3级别的自动驾驶当中,暂时还用不到C-V2X的联网功能,但是最高级别的L4、5级自动驾驶,却会在这项功能当中受益良多。随着车联网能力,特别是5G的到来,超低时延的网络接入,会为L4、5级自动驾驶带来更多且更有效互动信息。
写在最后
第三代Qualcomm骁龙汽车数字座舱平台的推出,不仅意味着高通将会在未来加大在汽车芯片领域的投入,意味着它将会把在智能手机领域积累的合作经验,移植到汽车领域的客户身上,届时我们将会看到更多类似于智能手机的人性化体验出现在的汽车座舱之中,而这恰恰是过往汽车厂商的短板,特别是进入5G时代之后,移动处理器平台与汽车之间还会有什么样的结合,将是令人期待的。疾如电,稳如山高通年度旗舰SoC骁龙855基准测试记
骁龙汽车数字座舱平台的参考设计模块
CES 2019期间,高通在美国茂宜岛新发布的高通年度旗舰SoC骁龙855的基准测试。本年度的跑分活动依旧是由QualcommTechnologies产品管理高级总监Travis Lanier主持。和去年一年,Travis还是首先表明了高通对于跑分测试的态度,即大家所推崇的跑分,只能测试到一块SoC整体很少的一部分能力,主要是CPU、GPU以及内存等,但是,这些基准测试并不能衡量芯片上的大部分功能。因此,分数固然是重要的,但是同时高通也希望大家在拿到这些终端之后,也可以关注这款终端所带来的体验,以及这些体验是如何实现的。游戏、XR、性能、功效、音频、图像品质和Al等表现是无法通过基准测试来衡量出来的。
但是,不管高通的工程师心中怎么“委屈”,但是CPU、GPU的能力,毕竟还是现在大家感受最直观的部分,也是用来衡量一块SoC基本身体素质的要素,因此也不得不跑。所以,Travis叉再次强调了全新骁龙855在这方面的能力:比如最新的Adren0 640,除了能图形渲染能力提升20%之外,更是具备业界领先的能耗比,同时也是业界第一款在手机上支持Vulkan l.1的GPU。
而CPU方面,则算是今年骁龙855最大的变化之一。Kry0 485从过往的4 4的大小核两级布局,升级为4 3 1的三级布局,其中最强悍的就是主频高达2.9GHz的A76架构超级内核(Prime Core)。它的加入,主要就是为了解决高通SoC传统的AP(应用处理)能力相比竞争对手不太强的问题。也正因为这个核心的加入,让骁龙855的CPU性能比起上一代提升了高达45%-不过这个趋势,在之前香港4G/5G峰会上亮相的骁龙675就已经体现出来了,只不过没想到高通会提升得这么猛。对此Travis说,这相当于在骁龙845 CPU性能的基础上,足足加入了一整个骁龙820的CPU性能。
但是,高通在大幅度提升CPU和GPU能力的同时,还没有忘记重要的一点,就是SoC的长时间大负荷工作下稳定的性能输出。对此Travis说,我们对两家7纳米制程竟品处理器(是谁大家很清楚吧)进行了常见的游戏基准测试,可以看到其中一家7纳米竞品一开始表现良好,但是在5分钟之后,游戏性能下降明显。相信大多数用户在玩游戏时,时长都会超过5分钟,所以在评测真正的游戏性能时,这个测试方法更有意义。而对于另一家竟品的游戏表现,看起来它还有很长的路要走。在游戏开始之后,7纳米制程的竞品处理器与我们10纳米制程骁龙845的游戏性能相当。这话说出来,在场的人都笑了,高通工程师这次对骁龙855真是信心爆棚,结果怎么样,后续跑分结果自会说明。 最后说到的,就是刚刚兴起的Al跑分,其实这也是这次骁龙855变化很大的部分。新加入的Hexagon 690 DPS,标量性能提升了20%,向量处理器内核从两个变为4个,而张量加速器是全新加入的。说到这里,高通SoC是否有独立NPU的问题又屡次被问起,其实早在之前参加骁龙峰会的时候,我就已经做过解释,但更有意思的并不是这个。在CES 2019开展之后,我们又采访了Qualcomm Technologies产品管理高级副总裁Keith Kressin,他主要负责的开发工作,就是骁龙SoC的性能部分。之前的茂宜岛,他被问到NPU问题的时候,还笑称:“只要能卖得好,你们爱怎么叫怎么叫!”
一个月以后,他的回答已经变了:“我想澄清—下Qualcomm骁龙855上的Al架构。骁龙855上有传统的DSP,在这个传统的DSP上因为有向量扩展所以它可以处理向量,同时传统的DSP也可以处理标量;在855上一共有4个向量内核。但同时要强调的一点是,在骁龙855上,我们还新增了独立的处理模块,它是一个独立的芯片硬件,我们称之为Hexagon张量加速器HTA(Hexagon Tensor Accelerator)。因此,我们有传统的Hexagon DSP,此外,我们新增了一个张量加速器一一在业界可能会被称之为NPU、DLA、神经网络引擎等等,但在Qualcomm,我们管它叫做Hexagon张量加速器HTA。Qualcomm将上述所有称之为Hexagon,因此,我们不仅仅是扩展了DSP的功能,而是实实在在的新增了一个独立的模块,只是从品牌角度.我们将它划分到Hexagon这个品牌名称下。因此,Hexagon张量加速器HTA是一个独立的物理实体芯片模块。从软件角度,在Hexagon里是协同工作的,比如一个程序员只需把一个Al算法发给Hexagon,Hexagon就会智能地分配哪些用张量加速器HTA处理,哪些让传统的DSP来处理。因此,它们在软件上是有关联的,但是它们采用的是不同架构、不同的设计,仅仅是都划分到Hexagon这个品牌名称下。”
Gary Brotman是负责骁龙SoC Al研发的工程师,他首先说明了骁龍855 Al运算硬件的提升情况:“与骁龙845相比,Adren0 640增加了50%的算数逻辑单元(ALU),同时我们也面向全精度和半精度网络进行了优化。另外,我们在Hexagon 690上增加了一个专门只针对Al处理的张量加速器,并且将向量扩展内核的数量从骁龙845上的2个增加到了现在的4个,同时也优化了标量处理和语音助理。最后,我们在Kry0 485上新增了对全新的点积指令的支持,比如在INT8网络下可以实现4倍的Al性能提升。”
但是众所周知,Al的运算,除了硬件能力之后,算法也同样重要,对此Gary也做了说明:“所以除了硬件内核之外,我们还有针对不同内核处理的库,包括针对CPU的Qualcomm Math Libraries、针对GPU的Open CL和针对Hexagon的Hexagon NN。此外,在运行软件框架方面,骁龙855不仅支持第一代Qualcomm人工智能引擎Al Engine上推出的神经处理SDK,用来发挥SoC异构计算的能力,并且还在Android O上加入了对Google NN API的支持,在Android P上新增对更多算子(operator)的支持,最后还有对TensorFlow Lite的支持。除了这些之外,我们还加入了对更多神经网络框架的支持,以便让开发者在编程时有更高的灵活性。”在这里有一个很让我印象深刻的小事情了。之前在2018年2月的MWC上,我特别问了Gary骁龙845的第三代Al Engine的卷积运算层数,当时得到的答案是120层,这次我也问了同样的问题,但是Gary没有第一时间答复,而是说:“我回去查—下答复你,但是很重要的一点,是算法升级,这方面的运算能力会有很大的不同。”几天后在高通安排的欢迎晚宴上,Gary特别拦住了我,说“你要的答案我有了。”然后他翻了翻手机,给我看了一个数字(然后他特别嘱咐我这个数字你可以知道但不要对外说)。从数字上看,骁龙855所搭载的第四代Al Engine卷积运算层数已经比上代提升了5倍不只,除了硬件性能的帮助之外,算法的提升帮助更大……-
写在最后
从整个得分来看,骁龙855已经足够可以称得是当前综合性能最强的旗舰级SoC了一一也难怪后边在采访Keith的时候,他的心情是如此之好。不过,作为商业化的芯片公司,高通面临的不仅仅是要推出性能强劲的SoC,更重要的还有如何能帮助OEM合作伙伴,能更多的采用这块旗舰SoC。不过好消息是,今年好像各家厂商对于骁龙855的态度,都比前代产品更积极,这对于涉及其中的所有人,包括高通、OEM厂商、还有消费者,应该都是好事情吧!