AI推理需求飙升推高内存芯片热度！

近年来，人工智能（AI）基础设施正在经历显著的变化。从以往对训练大型语言模型的硬件需求为主，到现在推理（Inference）工作负载逐步成为AI发展的重要推动力，相关市场格局正在悄然生变。

从训练到推理的重心转移

AI模型的训练环节需要强大的计算资源以及海量数据，以确保最终模型能够在现实中准确运行。而推理环节则是在实际应用中将已经完成训练的模型“推向前台”，用以处理新数据并提供即时响应。在这一背景下，面向推理的处理器设计需求日益旺盛。

外媒报道称，不少芯片设计商，如博通（Broadcom，美国）和英特尔（Intel，美国），均确认了其面向推理处理器的需求正在稳步增长。以博通为例，该公司目前与谷歌等全球超大规模云计算公司合作，研发专为推理设计的定制化AI芯片。英特尔则凭借其在服务器CPU及专用处理器领域的技术优势，也从推理工作负载的增长中受益。

此外，内存芯片的需求也显著攀升。高效的内存是提升数据中心AI加速器性能的关键技术之一。例如，美光科技（Micron Technology）与闪迪（Sandisk）等内存制造商，被认为可能是这一转向中最大的受益者。

AI计算中的推理趋势与市场新需求

根据外媒分析预计，今年推理工作负载将占到AI数据中心计算能力的约三分之二，而这一比例在2025年为50%。推理需求的上升将带动计算容量和存储容量的进一步提升。西部数据公司首席执行官Irving Tan在公司4月财报电话会议中也提到，从模型训练到大规模推理的过渡，让AI数据生成量进入了一个关键拐点。现阶段的趋势表明，未来推理将驱动大部分AI计算工作，这会显著增加数据的生成量，从而推高对相关存储解决方案的需求。

虽然推理过程所需的计算能力相比模型训练要小，但随着各类企业与消费者将AI广泛应用于提升生产效率，推理请求的数量预计将大幅度增长。目前，推理任务不仅在数据中心内执行，也越来越多地发生在边缘设备上，例如智能手机、个人电脑和汽车等。这进一步强化了对内存芯片的需求，因为内存性能直接影响AI模型响应的速度与效率。
AI基础设施转型：推理工作负载驱动内存与定制芯片需求增长