AI推理需求飙升推高内存芯片热度!

近年来,人工智能(AI)基础设施正在经历显著的变化。从以往对训练大型语言模型的硬件需求为主,到现在推理(Inference)工作负载逐步成为AI发展的重要推动力,相关市场格局正在悄然生变。
从训练到推理的重心转移
AI模型的训练环节需要强大的计算资源以及海量数据,以确保最终模型能够在现实中准确运行。而推理环节则是在实际应用中将已经完成训练的模型“推向前台”,用以处理新数据并提供即时响应。在这一背景下,面向推理的处理器设计需求日益旺盛。
外媒报道称,不少芯片设计商,如博通(Broadcom,美国)和英特尔(Intel,美国),均确认了其面向推理处理器的需求正在稳步增长。以博通为例,该公司目前与谷歌等全球超大规模云计算公司合作,研发专为推理设计的定制化AI芯片。英特尔则凭借其在服务器CPU及专用处理器领域的技术优势,也从推理工作负载的增长中受益。
此外,内存芯片的需求也显著攀升。高效的内存是提升数据中心AI加速器性能的关键技术之一。例如,美光科技(Micron Technology)与闪迪(Sandisk)等内存制造商,被认为可能是这一转向中最大的受益者。
AI计算中的推理趋势与市场新需求
根据外媒分析预计,今年推理工作负载将占到AI数据中心计算能力的约三分之二,而这一比例在2025年为50%。推理需求的上升将带动计算容量和存储容量的进一步提升。西部数据公司首席执行官Irving Tan在公司4月财报电话会议中也提到,从模型训练到大规模推理的过渡,让AI数据生成量进入了一个关键拐点。现阶段的趋势表明,未来推理将驱动大部分AI计算工作,这会显著增加数据的生成量,从而推高对相关存储解决方案的需求。
虽然推理过程所需的计算能力相比模型训练要小,但随着各类企业与消费者将AI广泛应用于提升生产效率,推理请求的数量预计将大幅度增长。目前,推理任务不仅在数据中心内执行,也越来越多地发生在边缘设备上,例如智能手机、个人电脑和汽车等。这进一步强化了对内存芯片的需求,因为内存性能直接影响AI模型响应的速度与效率。
新媒网(公号: 新媒网跨境发布),是一个专业的跨境电商、游戏、支付、贸易和广告社区平台,为百万跨境人传递最新的海外淘金精准资讯情报。
本文来源:新媒网 https://nmedialink.com/posts/ai-inference-drives-memory-demand.html


粤公网安备 44011302004783号 













