应用

技术

物联网世界 >> 物联网新闻 >> 物联网热点新闻
企业注册个人注册登录

人工智能(AI)处理器竞争升温:CEVA的AI处理器深入深度学习边缘

2018-01-08 12:08 万物云联网

导读:NeuPro处理器系列将AI的应用扩展到机器视觉(machine vision)以外的基于边缘的应用,包括自然语言处理,实时翻译,认证,工作流管理以及许多其它基于学习的应用,使设备变得更加智能并减少人为干预。该架构由基于硬件和基于软件的引擎组合而成,可实现完整的,可伸缩性的和可扩展性的AI(人工智能)解决方案。针对每个应用层使用硬件,软件和可配置的性能选项的精确混合来实现对功耗,性能和面积(PPA, power, performance, and area)的最优化处理。

1.jpg

  图1、CEVA的AI处理器深入深度学习的边缘

  CEVA的NeuPro人工智能(AI)处理器系列专为网络边缘的深度学习(deep learning)推理而设计,面向寻求采用简化方式快速利用深度神经网络技术提供的重大可能性的智能和边缘连接设备供应商。这款专用的AI处理器的性能得到了大幅提升,其范围包括从入门级处理器的2 Tera OPS(TOPS,每秒万亿OPS(操作指令))处理速度到最高级配置的12.5 TOPS处理速度。

2.jpg

  图2、CEVA的NeuPro人工智能(AI)处理器架构

  NeuPro处理器系列将AI的应用扩展到机器视觉(machine vision)以外的基于边缘的应用,包括自然语言处理,实时翻译,认证,工作流管理以及许多其它基于学习的应用,使设备变得更加智能并减少人为干预。该架构由基于硬件和基于软件的引擎组合而成,可实现完整的,可伸缩性的和可扩展性的AI(人工智能)解决方案。针对每个应用层使用硬件,软件和可配置的性能选项的精确混合来实现对功耗,性能和面积(PPA, power, performance, and area)的最优化处理。

  CEVA的NeuPro人工智能(AI)处理器系列包括:

  NP500是最小的处理器,包括512个MAC单元,面向物联网,可穿戴设备和相机应用;

  NP1000包含1024个MAC单元,面向中档智能手机,ADAS,工业应用和AR / VR头盔等应用;

  NP2000包括2048个MAC单元,瞄准高端智能手机,监控,机器人和无人机等的应用;

  NP4000包括4096个MAC单元,用于企业监控和自动驾驶等应用所需的高性能边缘处理;

3.jpg

  图3、CEVA的NeuPro人工智能(AI)处理器系列

  每个处理器由NeuPro引擎和NeuPro VPU组成。 NeuPro引擎包括神经网络层的硬连线实现,其中包括卷积,完全连接,资源池和激活等功能。 NeuPro VPU是一款经济高效的可编程矢量DSP,可处理CDNN软件,并为AI工作负载的新进展提供基于软件的支持。 NeuPro同时支持8位和16位神经网络,实时优化决策,实现精度和性能之间的最佳平衡。 MAC单元在运行时的利用率达到90%以上,以确保高度优化的神经网络性能。处理器整的体设计大大降低了DDR所需的带宽,改善了任何AI应用的功耗水平。

4.jpg

  图4、CEVA的神经网络软件框架CDNN相结合

  NeuPro系列与CEVA的神经网络软件框架CDNN相结合,为开发人员提供了一个深度学习解决方案,用于生成专有的神经网络并将其移植到处理器。 CDNN支持完整的色域类型和网络拓扑。

5.jpg

  图5、卷积神经网络加速器设计

  结合NeuPro处理器产品线,CEVA还将提供NeuPro硬件引擎作为卷积神经网络(CNN,Convolutional Neural Network)的加速器。当与CEVA-XM4或CEVA-XM6视觉平台相结合时,它为寻求单一统一平台的客户提供了一个选择,可以用于成像,计算机视觉和神经网络等的工作负载中。 NeuPro将在于2018年第二季度可以为特定客户提供授权使用,而在2018年第三季度提供一般授权。

6.jpg

  图6、CEVA的人工智能(AI)解决方案