边缘处理AI的嵌入式硬件:GPU,VPU,FPGA和ASIC的解释说明

IT系统在企业和企业中迅速发展,并且不断增长的趋势正在将计算能力转移到边缘。 Gartner预测,到2025年,边缘计算将处理 75%的数据 由所有用例生成,包括工厂,医疗保健和运输中的用例。您可以将边缘计算的采用与 人工智能的兴起 (AI),这使工厂变得更加智能,改善了患者的病情,提高了自动驾驶汽车的安全性,并且数据量的增长比以往任何时候都要大。来自制造设备,传感器,机器视觉系统和 仓库管理系统 在一个智能工厂中,每天轻松就能总计1 PB。 

当企业首次部署嵌入式系统时,他们的系统架构师无法想象AI,物联网(IoT)和其他先进技术会生成的数据量。现在情况已经改变,十年前的嵌入式系统必须适应当今的边缘计算。 

如今,许多AI工作负载都在云中进行处理。但是,随着越来越多的高带宽数据对这些系统提出越来越高的要求,在延迟,可靠性,移动性,安全性,能效和数据传输成本方面,在边缘处理数据变得有意义。  

为了满足当今的新需求,硬件必须从基于控制和规则的系统发展到以数据为中心的环境,以适应边缘AI。 

边缘AI工作负载的处理器类型指南 

处理AI工作负载的硬件要求因使用案例而异。 AI可以利用各种输入,包括视频,图像,音频,传感器和PLC数据。系统架构师面临的挑战是为其AI应用程序选择最佳的计算核心。  

本指南将帮助您了解可在边缘系统中使用的不同类型的处理核心及其优势。  

  1. 中央处理器 

中央处理单元(CPU)是通常具有4至16个内核的通用处理单元。 CPU运行复杂的任务并促进系统管理。 

它们可与混合数据输入(例如同时使用音频和文本的系统以及提取,转换和加载(ETL)流程)配合使用。 

  1. 显卡 

图形处理单元(GPU)是高度并行的内核(100或1,000s),用于高速图形渲染。它们提供高性能处理,并且通常比CPU具有更大的占用空间和更高的功耗。 

由于小核数量众多,GPU非常适合AI工作负载,从而促进了神经网络训练培训和AI推理。 

  1. 现场可编程门阵列 

现场可编程门阵列(FPGA)是可配置的逻辑门,其功耗低于CPU和GPU。它们使具有编程专业知识的工程师能够进行现场重新编程。 

当需要高度灵活性时,它们可能是最佳选择。 

  1. 专用集成电路 

专用集成电路(ASIC)是使用制造商的电路库设计的定制逻辑,具有功耗低,速度快和占用空间小的优点。但是,它们设计很耗时,而且比其他选择要昂贵,因此建议将ASIC用于大批量运行的产品。   

ASIC的类型包括: 

  • 视觉处理单元(VPU),图像和视觉处理器以及协处理器 
  • Tensor处理单元(TPU),例如Google针对其机器学习框架TensorFlow开发的第一个TPU 
  • 神经计算单元(NCU),包括来自ARM的神经计算单元 

每种核心类型都适用于不同类型的计算-并在以下计算中一起使用 异构计算应用 提供复杂用例所需的所有功能。一起使用,它们还可以平衡工作负载,提高不同的AI推理性能,并构建最具成本效益和最有效的配置。 

图1.用于AI应用程序的异构边缘计算架构选项

为Edge AI选择嵌入式硬件的步骤 

选择嵌入式边缘硬件系统以在边缘处理AI通常需要评估三个主要因素: 

表现  

核心硬件系统必须能够提供复杂的,数据密集型边缘AI应用程序所需的速度,同时即使在恶劣的环境中也能始终如一地可靠运行。 

交换  

SWaP是尺寸,重量和功率的首字母缩写。除了提供应用程序所需的功能外,边缘硬件还必须满足尺寸和重量方面的规范,以符合应用程序的物理限制,并从功耗的角度出发最有意义。 

成本 

边缘硬件的成本可能会有所不同-取决于内核和制造商的类型。有必要确定以最佳价格提供哪些功能和规格,以满足您的项目需求。 

图2.比较边缘AI硬件的核心类型

边缘硬件在工作  

以下示例只是边缘硬件创新使AI如今能够交付价值的众多用例中的几个。 

深度学习加速平台 

深度学习加速平台(DLAP)支持各种功能,包括数据采集,图像预处理,图像分析和AI加速。它们还使机器具有改善自身性能和做出决策的能力。通过替换将数据发送到云以使用DLAP进行处理的传统边缘设备,操作可以看到更快的响应以及更高的安全性和控制力。 

DLAP可以利用异构设计,例如,使用CPU管理数据采集和图像预处理,使用GPU加速并行任务处理,同时保持边缘系统的小型化和高能效。 

凌华科技的DLAP系列 例如,设计用于在恶劣的工业或嵌入式环境中,在极端温度,高湿度下以及在常见冲击和振动的使用情况下运行时的性能;我们称此为针对边缘AI的SWaP优化。 ADLINK的紧凑型单元在模块上包含NVIDIA®Quadro®嵌入式GPU或NVIDIA®Jetson™超级计算机,可用于基于AI的推理,机器视觉和自主机器控制应用程序。 

例子  

AI自检: 悠闲的午餐已成为过去,人们正在寻找 快速购买餐食的方法。自助服务的采用在消费者中正在增长,并且AI可以使客户体验现代化。在餐厅或商店结帐时,机器视觉可通过一次扫描识别出物品,并使用ADLINK DLAP-211-JT2在不到1.5秒的时间内显示应付款总额。客户可以快速方便地完成购买。

移动X射线C型臂: 医疗设备必须可靠,耐用且设计为高性能。移动设备还必须将所有必要的计算能力打包到一个低功耗的紧凑型设计中。 CPU和嵌入式MXM GPU模块(世界上最小的启用了工业GPU的系统)的组合符合这些规范。 

模块上的AI 

移动PCI Express模块(MXM)GPU使您可以在手掌大小的图形卡中运行AI。它们具有SWaP的主要优势,包括尺寸仅为全长PEG卡的一小部分。它们提供了每瓦高性能,并且设计用于极端条件,例如通风受限或无通风,狭小空间,高温或低温以及多尘甚至腐蚀的环境。 

例子 

AI面部识别: 访问控制对于防止未经授权进入制造工厂,研究设施,数据中心和其他高度受控区域至关重要。 AI面部识别门无需使用ID卡(可以伪造),并用几秒钟内就能识别授权用户(即使他们戴着眼镜或戴帽)的技术取代了那些旧系统。它甚至可以区分真实的人脸和照片。 

机场安全: 与传统的监视系统相比,机场全景监视系统可提供360度的跑道,空中和地面交通视图,并具有更高的态势感知能力。这些AI技术由坚固耐用的无风扇边缘设备提供支持,该设备专为室外使用而设计,并与高性能GPU集成在一起,可在白天和晚上进行更好的监控。   

边缘机器人 

硬件创新也在使 边缘机器人。你听到了吗 Eclipse Cyclone DDS 已被选为2021年5月即将发布的默认ROS 2中间件?这很令人兴奋,因为它与我们内部的数据分发服务(DDS)技术相同 ROScube嵌入式机器人控制器,它可以帮助机器人与自己以及周围的世界进行交流。  

例子: 

制造业中的自主移动机器人: 由边缘AI驱动的AMR可以使用机器视觉,5G和DDS技术来协商其环境并了解上下文。 公平朋友集团,台湾最大的制造商之一正在使用5G over DDS基础架构来实现增强现实的远程维护,用于自动检查的机器视觉以及用于工厂物料搬运的AMR群。

人工智能 机器视觉  

基于AI的机器视觉系统利用集成的工业相机和边缘计算系统以及嵌入式高性能GPU,VPU和CPU来执行任务。由于所有计算能力都处于边缘,因此消除了对延迟和带宽的担忧。此外,借助最先进的硬件,智能相机可以维持AI机器视觉的小尺寸,重量,功率,性能和成本要求。  

例子: 

仓库履行: 第三方物流和供应链公司Evans Distribution Systems正在使用AI机器视觉系统来快速准确地履行美国女童军的女童军饼干订单,美国女童军是著名非营利组织最受欢迎的筹款人之一。根据一个 最近的采访,该系统的准确度超过99.8%,从而提高了生产率和准确的客户出货量。

亲自探索适用于Edge AI的创新嵌入式硬件 

凌华科技将在以下地点展示用于边缘AI的一系列硬件 2021年嵌入式世界 数字的。这次会议是您与ADLINK工程师,合作伙伴和边缘系统专家建立联系的机会,他们随时准备帮助您为用例选择最佳的嵌入式硬件。 在此处免费注册#ew21 使用促销代码:ew21456845。

作者:赞恩·蔡
作者:赞恩·蔡

凌华科技嵌入式平台与模块平台产品中心总监