Imagination第二代神经网络加速器和第九代GPU推出,AI应用如何影响芯片设计?

包永刚 雷锋网

▲点击上方 雷锋网 关注

文 | 包永刚

来自雷锋网(leiphone-sz)的报道

去年,Imagination失去最大客户苹果引发业界巨大的关注,最终Imagination被Canyon Bridge收购成为了一家中资公司。雷锋网消息,Imagination被收购之后财务非常稳健,并且越来越重视中国市场。12月4日,Imagination在深圳发布了最新的的神经网络加速器(NNA)架构PowerVR Series3NX和第九代GPU系列新品PowerVR 9XEP、 9XMP和9XTP。


神经网络加速器提升PPA同时注重灵活性

最新推出的PowerVR 3NX系列基于前代产品,Imagination Technologies视觉和人工智能产品管理高级总监Neal Forse表示:“PowerVR 3NX系列基于我们屡获殊荣的2NX系列产品,相比2NX系列,3NX系列实现了芯片面积40%、性能效率近60%的提升,同时降低了35%的带宽需求,可以满足汽车、移动设备、物联网等嵌入式设备市场的需求。”

Imagination Technologies视觉和人工智能产品管理高级总监Neal Forse

Neal强调, 3NX系列在2NX系列之所以有明显的提升,是因为Imagination进行了多方面的改进和创新。但对于具体做了哪些改进和创新的问题,Neal对雷锋网表示更多细节不方便透露。

因此,我们只能从3NX系列提升了解Imagination的新品。相比2NX系列AX2145 1Tops和AX2185 4.1Tops的运算性能,3NX系列的两个同级别新核AX3145和AX3385的性能分别是1.2TOPS、 5TOPS,还有三个新核AX3125、AX3365、AX3595,对应的性能为0.6TOPS、2.4TOP、10TOPS。Imagination此次还推出了多核产品,性能从20TOPS到160TOPS不等。

还有值得一提的是,除了性能覆盖0.6TOPS到160TOPS满足应用的多样性需求,PowerVR 3NX-F(Flexible)可以提供更多的灵活性。之所以要推出这个架构,Neal表示有两方面的原因,一方面是可以让芯片设计公司在单核上做差异化,利用IP核构建神经网络加速器,而不需要把第三方GPU整合在一起,差异化对激烈的市场竞争而言非常关键;另一方面是神经网络行业正在快速发展,新技术、新框架需要可编程性和扩展性更强的SoC。

除此之外,3NX在安全性方面也有提升。同时,为迎合快速发展的市场,Imagination新的PowerVR工具也进行了多项扩展,为的是更好地映射新兴的网络模型、提供灵活性和性能优化的理想组合。

那么,满足AI需求硬件还是软件更加重要?Neal认为软件和硬件同等重要,硬件的异构可以实现更高效率,但缺少软件也没有意义。异构架构是Imagination拥抱AI的策略,软件方面Imagination的SDK里有Open API,塔建在Open CL之上,C++语言就可以在异构的IP中运行,降低用户使用复杂性的同时最大化灵活性。

据雷锋网了解,Imagination的第一代神经网络加速器产品2NX系列已经授权的用户主要集中在移动设备和汽车市场,并且有两家中国的手机厂商也使用了2NX神经网络加速器。3NX除了移动和汽车两大市场之外,智能相机监控、消费电子(尤其是数字电视)、低功耗IoT智能设备都是关键市场。

另外,Imagination Technologies副总裁兼中国区总经理刘国军表示:“国内包括监控、手机、物联网领域的公司都在评估我们的神经网络加速器。我们也在发展中国的生态系统,与手机厂商、OEM厂商直接一起工作,了解他们要做的AI应用,我们设计出更合适的AI的处理器去满足,我们从早期就介入。”

Imagination Technologies副总裁兼中国区总经理刘国军

这就意味着,AI的发展需要软件和硬件更好地结合,Imagination与手机和OEM厂商的紧密协作AI应用已经开始影响AI芯片的架构设计,性能、功耗、芯片面积、灵活性都是AI芯片的关键特性。


第九代PowerVR GPU带宽和内存占用率至少节省50%

AI芯片市场的竞争格局未定,在移动GPU领域Imagination具备领先优势,PowerVR GPU的持续迭代是其保持竞争优势和拓展市场的关键。Imagination Technologies PowerVR图形处理商务运营副总裁Graham Deacon指出,如今手机游戏市场的改变以及特殊的应用需求让GPU朝着成本更低,性能更高、更多灵活性以及更小芯片面积的方向发展。为了应对市场的趋势,Imagination的第九代PowerVR GPU新品包含 9XEP、 9XMP和9XTP,满足从低端到高端市场的需求。

Imagination Technologies PowerVR图形处理商务运营副总裁Graham Deacon

据介绍,XEP主要关注GUI,也就是图像界面,包括休闲游戏、填充力密度,最小面积上提供最高的填充率。9XEP可以实现每个时钟周期1-8个像素,16-64个FP32 OPS的性能,主要面向数字电视和低端手机市场。9XMP可以在最低的面积有最佳的计算能力,性能为每个时钟周期4-8个像素,128-256 FP32 Ops,主要是瞄准中端手机市场和低端汽车市场。9XTP是旗舰型产品,在密度、功率、效率方面都有提升,并且架构也是可伸缩的,性能可以达到每时钟周期8个像素,192FP32 Ops,甚至超更高。

另据了解,9XEP和9XMP都基于Rogue架构,这个架构已经非常成熟,不过9XEP架构进行了微调,9XMP将每个集群的ALU扩展了2倍,位宽从16位扩展到32位,目的都是提高性能。9XTP则是基于Furian架构,该架构由Rogue演变而来。Graham Deacon表示,虽然Furian架构还不够成熟,但这也意味着我们还有很多机会进行改进,也能让这个架构更具灵活性。

虽然架构有所不同,但相同的是新GPU都采用PVRIC4技术,PVRIC4是Imagination图像压缩技术的最新一代,可实现随机访问视觉无损图像压缩,确保带宽和内存占用率至少节省50%,并使系统能够去克服性能带宽限制。与Imagination的上一代GPU相比,新的GPU系列还提供性能/功耗/面积和时序优化,以及包括可降低合成的工作负载带宽和成本的全新alpha缓冲/单元模块提示等在内的新功能。

从Graham Deacon展示的图中可以看到,借助9XMP可以提升图像的质量,让游戏中的图像细节更加真实,不过对比三款新GPU的显示效果,其显示的图像细节和效果也有着容易分辨的差别。

还需指出的是,PowerVR GPU利用了一项被称为分块延迟的渲染(TBDR)技术,TBDR保证了几乎所有的图形处理都在“芯片上”完成,并将存储带宽的需求降至最低。基于多方面的优势,过去的25年PowerVR GPU已经支持了最受欢迎的游戏和街机系统,并推动了移动设备的图像革命。如今PowerVR GPU已经在汽车虚拟仪表、娱乐系统中占有非常高的市场份额,手机、数字电视也将继续是PowerVR GPU的重要市场。

还有,新的GPU可以与PowerVR Series3NX神经网络加速器配对使用。刘国军也表示:“中国许多做汽车电子的公司以前在后装市场,现在他们想要进入前装市场,产品就需要满足车规的要求。因此,我们会与芯片设计公司和Tier1合作,把我们的GPU和神经网络加速器都放到车规的生态里,共同满足汽车市场的需求。”

雷锋网在采访中还了解到,Imagination可能会宣布推出面向AI训练的GPU。对于目前比较火热的RISC-V架构,Imagination的态度是作为GPU IP的提供商会支持不同的CPU架构,目前他们的客户有两家都在使用RISC-V。


雷锋网小结

作为IP提供商,Imagination关注的是提供基础框架,并能够实现最优化的功耗和性能满足芯片设计公司和应用的需求。作为以技术见长的公司,Imagination并没有因为失去大客户而一直摇摆不定,在被中资收购后以及资本的支持下保持着产品的更新。如今PowerVR GPU已经在汽车市场取得了不错的成绩,手机市场也能让其客户与高通竞争。

至于神经网络加速器,正如刘国军所说,每家厂商的起点不一样,大家也是传承自己的技术推出神经网络加速器。虽然手机厂商也都纷纷自主研发NPU,有可能是在用第一代产品去市场试水发现优缺点,未来为更好满足AI应用的需求,具备更好性能和功耗指标的AI芯片必不可少,也可能使用第三方的IP。


- END -

  ◆  


推荐阅读

华为 5G 设备被新西兰政府禁用,中国外交部回应

曝恒大全面接管FF中国;富士康被证实将在美国裁员;微博确认收购一直播

京东回应裁员:系造谣,已报案;曝Uber与黑客“私了”销毁数据泄漏证据




关于「AI投研邦」


雷锋网旗下会员组织,聚焦AI+10大领域 :AI+汽车(智能驾驶)、AI+教育、AI+金融、AI+智慧城市、AI+安防、AI+医疗等。早鸟限量999份,欢迎加入。



    阅读原文

    + 关注

    + 订阅

    扫描二维码推荐公众号

    微信公众号