CPU推理:AI算力配置新范式
在当前的人工智能领域,尤其是涉及到深度学习的推理阶段,行业普遍认为GPU是唯一的选择。然而,GPU的成本相对较高,且对于某些特定的应用场景,其高昂的价格和较高的能耗成为了一大负担。
相比之下,CPU作为一种性价比极高的推理硬件,逐渐进入了人们的视野,尤其是在对结果准确度有较高要求且需要考虑成本效益的行业中,如制造业、图像处理与分析等。经过数年的内部研究,阿丘科技的工业AI视觉算法平台软件AIDI已经成功验证了CPU推理的可行性,为行业提供了新的解决方案。
一、具体应用场景
1. 旧产线改造
许多制造企业的生产线启动时间较早,初期采用的传统算法并不过多依赖于GPU资源。随着时间的发展,这些产线的主板可能无法支持新增的GPU、NPU、TPU等加速卡。
在这种情况下,如果企业希望在其生产线上添加AI检测功能,全面更换工控机会导致成本激增,并延长上线周期。通过使用AIDI提供的CPU推理模式,企业可以迅速实现AI检测功能的上线,同时避免了高昂的硬件升级费用。
*相关词语解释:
CPU(中央处理器,Central Processing Unit):计算机的主要处理单元,负责执行系统中的大部分基本指令集,包括算术逻辑运算、控制单元的功能以及数据的移动等。它通常设计为能够高效地处理广泛的任务,从运行操作系统到执行应用程序的各种任务。
GPU(图形处理器,Graphics Processing Unit):最初是为加速计算机图形渲染而设计的处理器,但现在其应用范围已经远远超出了图形处理领域。GPU拥有大量的核心,能够并行处理大量数据,这使得它们在图像和视频处理、深度学习、科学计算等领域非常有用。
NPU(神经网络处理器,Neural Network Processing Unit):一种专门为处理机器学习算法而设计的微处理器,尤其是针对深度学习任务。NPU优化了对向量和矩阵运算的支持,这些运算是神经网络训练和推理过程中的基础。
TPU(张量处理单元,Tensor Processing Unit):由谷歌开发的一种定制ASIC(专用集成电路),专门用于加速机器学习工作负载,特别是针对使用TensorFlow框架的应用程序。TPU能够高效地执行大规模的矩阵运算,这对于训练和推断阶段的深度学习模型至关重要。
2. 轻量型项目
对于一些新的项目,尤其是那些算力需求较小的场景(如图像小于500万像素,仅需进行图像分类或单图推理,且可接受100毫秒的延迟),使用单个GPU卡往往无法达到满负荷运行的状态,从而造成资源浪费。
这类项目非常适合采用CPU进行推理,训练阶段则可以利用GPU工控机或云端资源。这种方法不仅能够显著降低硬件采购成本,还能确保项目的顺利推进。
3. 旧产线改造的具体情形
如下图所示,通过传统算法进行项目的测量与检测,硬件配置主要为CPU+内存+主板。
目前,旧产线改造通常有以下两种情形。
情形一:硬件配置基本不变,即CPU+内存+主板,通过传统算法做测量,而利用AI算法做外观检测。
情形二:硬件配置基本不变,即CPU+内存+主板,通过传统算法做测量与外观检测,而利用AI算法做缺陷复判。
二、AIDI-CPU推理的优势
1. 推理速度比肩GTX1060,500万图像像素级推理仅需50ms
AIDI的CPU推理在速度方面表现出色,其底层采用DefectNet网络+Aqinfer推理引擎的创新模式。
DefectNet网络专门针对工业数据的特性而设计,具备轻量且检测能力强的特点。Aqinfer自研推理引擎则针对工业场景中图像分辨率高、目标小的特点,在原本就较高的推理速度基础上,进一步优化计算速度。
2. 节省硬件成本,降低耗能风险
CPU在市场上供应充足,价格相对更为亲民,相较于一些高性能GPU,CPU的获取成本更低。对于企业来说,尤其是预算有限的中小企业,选择CPU推理可以在不牺牲太多性能的前提下,大幅降低硬件采购成本。
以一家小型服装加工厂为例,在引入AI检测系统时,如果选择GPU方案,高昂的硬件成本可能使其望而却步;而采用CPU推理方案,仅需利用现有的工控机资源,就能实现基本的质量检测功能。
同时,GPU的高功耗不仅增加了企业的用电成本,还会导致设备硬件容易因过热等问题而损坏。相比之下,CPU的功耗较低,运行更加稳定,能够有效降低企业的能耗风险和设备维护成本。在长期运行过程中,这一优势将为企业节省大量的资金和人力投入。
3. 快速验证,减少额外投资
利用CPU进行AI推理,企业可以充分挖掘既有平台的空闲算力,避免了为新的算力需求而进行大规模的额外投资。在项目的初期验证阶段,CPU推理能够快速搭建起一个低成本的测试环境,帮助企业快速验证AI算法的可行性和有效性。例如,视觉团队可以先在现有的服务器上利用CPU进行算法验证,根据验证结果再决定是否需要进一步投资更强大的GPU算力。
三、成功案例
在某胶体检测项目中,产品的检测项涵盖少胶、溢胶、断胶、漏胶等关键指标。老设备方案中,胶水识别采用的是传统算法,但在实际应用中,偶尔会出现定位不准的问题,这对产品质量产生了一定的影响。为了提高检测精度,降低过检率,企业决定引入AI检测方案。
由于新增GPU需要对工控机配置进行复杂的修改,并且采购流程耗时较长,为了确保产线的正常运行,不耽误生产进度,项目团队最终选择了CPU推理方案。经过实际测试和验证,该方案能够直接上线,并且取得了令人满意的效果。
在此次项目中,图像分辨率为1000W,客户要求的CT(Cycle Time,周期时间)为1000ms,而实际CT时间仅为500ms,单图推理时间更是缩短至100ms,完全满足了上线要求。这一案例充分证明了阿丘科技AIDI的CPU推理在实际工业场景中的可行性和有效性,为其他类似项目提供了宝贵的参考经验。
综上,CPU推理作为AI算力配置的新范式,在特定的应用场景中展现出了独特的优势。随着技术的不断发展和优化,相信阿丘科技AIDI的CPU推理将在更多领域得到广泛应用,为企业的智能化转型提供更加经济、高效的解决方案。