AI吞噬内存芯片！全球科技巨震，你的手机电脑恐涨价！

人工智能，这个既神秘又充满潜力的领域，正以前所未有的速度改变着我们的世界。它不再是科幻电影中的遥远设想，而是我们日常生活中触手可及的现实。然而，伴随着AI技术的飞速发展，各种专业术语也如潮水般涌现，让不少朋友感到一头雾水。为了帮助大家更好地理解这个新时代的关键技术，新媒网跨境特意整理了一份常用AI术语指南，希望能为大家揭开人工智能的神秘面纱。我们将持续更新这份指南，以便大家及时了解AI前沿的最新进展和潜在风险。

通用人工智能（AGI）

通用人工智能，简称AGI，听起来似乎有些模糊，但它大致指的是那种在大多数乃至绝大多数任务上，能力都超越普通人类的人工智能系统。美国OpenAI公司首席执行官萨姆·阿尔特曼曾将AGI描述为“一个你可以雇佣的、能力与普通人相当的同事”。而OpenAI的章程中则将其定义为“在大多数具有经济价值的工作中，表现超越人类的高度自主系统”。美国谷歌旗下DeepMind实验室对AGI的理解略有不同，他们认为AGI是“在大多数认知任务上至少与人类能力相当的AI”。是不是感觉有些困惑？别担心，即使是站在AI研究最前沿的专家们，也常常对这个概念有着各自的解读和探讨。AGI的实现，意味着人类社会可能迎来一次翻天覆地的变革，生产力将得到极大的提升，许多重复性和脑力劳动将被AI承担，人类将有更多精力投入到创造性工作中。当然，随之而来的伦理、就业和社会结构调整等问题，也需要我们提前思考和规划。

AI智能体

AI智能体，顾名思义，它是一种能够利用人工智能技术，替我们完成一系列复杂任务的工具。它的能力远超传统的AI聊天机器人，比如，它可以自主报销、预订机票或餐厅座位，甚至能够编写和维护代码。当然，由于这个新兴领域仍在快速发展，对于“AI智能体”的定义，不同的人可能有不同的理解。支撑其设想功能的底层基础设施也还在不断完善之中。但其核心概念，就是指一个能够自主运作的系统，它可能需要整合多个AI系统来执行多步骤的任务。想象一下，未来你的个人AI智能体能帮你管理日程、处理邮件，甚至根据你的偏好推荐并预订旅行计划，这将是多么便捷的生活场景。

思维链

面对一个简单的问题，比如“长颈鹿和猫哪个更高？”，我们的大脑几乎无需思考就能给出答案。但在很多情况下，我们需要笔和纸来辅助思考，因为解决问题需要中间步骤。例如，如果一个农民有鸡和牛，它们总共有40个头和120条腿，你可能需要列一个简单的方程才能得出答案（20只鸡和20头牛）。在人工智能领域，大型语言模型的“思维链”推理，指的是将一个复杂问题分解成更小的、中间的步骤，从而提高最终结果的质量。虽然获得答案所需的时间可能会长一些，但答案的正确性会大大提升，尤其是在逻辑推理或编程的场景中。这些推理模型是在传统大型语言模型的基础上发展起来的，并通过强化学习等方式，专门针对思维链思考进行了优化。思维链技术是提升AI理解和解决复杂问题能力的关键一环，它让AI不再是简单的模式匹配，而是具备了类似人类的逻辑分析能力，这对于AI在科研、工程等领域的应用具有深远意义。

算力

“算力”这个词汇，虽然有时听起来有些抽象，但它却是推动整个人工智能产业发展的核心动力。它通常指的是支撑AI模型运行所必需的强大计算能力。正是有了这样的处理能力，AI产业才能训练并部署其强大的模型。这个词也常常被用来指代提供这种计算能力的硬件设备，比如图形处理器（GPU）、中央处理器（CPU）、张量处理器（TPU）以及其他构成现代AI产业基石的基础设施。可以说，算力是AI时代的“新能源”，其充足与否直接关系到AI技术的发展速度和应用广度。各国都在大力投资算力基础设施建设，争取在这一关键领域占据领先地位。

深度学习

深度学习是机器学习领域的一个重要分支，它通过设计具有多层人工神经网络结构的AI算法，让机器能够自我改进。与线性模型或决策树等更简单的机器学习系统相比，深度学习能够发现数据中更为复杂的关联模式。深度学习算法的结构灵感来源于人类大脑中神经元相互连接的通路。深度学习AI模型能够自主识别数据中的重要特征，而无需人类工程师预先定义这些特征。这种结构也支持算法从错误中学习，并通过重复和调整的过程来不断改进自身的输出。然而，深度学习系统需要海量的数据点（通常是数百万甚至更多）才能取得良好的效果。与更简单的机器学习算法相比，它们的训练时间也通常更长，因此开发成本往往更高。深度学习的突破，使得AI在图像识别、语音识别等多个领域取得了革命性进展，是当前AI繁荣的重要基石。

扩散模型

扩散技术是许多生成艺术、音乐和文本的AI模型的核心。它受到物理学中扩散现象的启发，通过逐渐向数据结构（例如照片、歌曲等）中添加“噪声”，直到其原始结构完全被“破坏”。在物理学中，扩散是自发且不可逆的——例如，溶解在咖啡中的糖无法恢复为方糖。但AI中的扩散系统旨在学习一种“逆向扩散”过程，从而能够从噪声中恢复被“破坏”的数据。这种“逆向”学习的能力，使得AI能够从无序中创造有序，生成出高度逼真、富有创造性的内容。扩散模型在文生图、图生图等领域展现出惊人的效果，极大地拓宽了数字内容创作的可能性，甚至开始走进电影、游戏等产业，为创作者提供了前所未有的工具。

模型蒸馏

模型蒸馏是一种从大型AI模型中提取知识的技术，它采用“师生”模型模式。开发者向“教师”模型发送请求，并记录其输出。有时会与数据集进行比较，以评估答案的准确性。然后，这些输出被用来训练“学生”模型，使其行为尽可能地接近“教师”模型。蒸馏技术可以用于创建基于大型模型而规模更小、效率更高的模型，同时将知识损失降到最低。新媒网跨境获悉，美国OpenAI公司很可能就是通过这种方式开发出GPT-4 Turbo，一个比GPT-4速度更快的版本。尽管所有AI公司都在内部使用蒸馏技术，但一些公司也可能利用它来追赶前沿模型。然而，对竞争对手模型进行蒸馏通常会违反AI API和聊天助手的服务条款。模型蒸馏对于AI模型的实际部署具有重要意义，尤其是在资源受限的边缘设备上，它使得高性能AI模型能够以更小的体积和更低的能耗运行。

微调

“微调”指的是对AI模型进行进一步训练，以优化其在特定任务或领域的性能，使其超越之前训练的重点。这通常通过输入新的、专门化的（即面向任务的）数据来实现。许多AI初创公司都以大型语言模型作为起点来开发商业产品，但他们会通过在其自身的领域特定知识和专业技能基础上进行微调，来增强模型对目标行业或任务的实用性。这种做法能够让通用AI模型更好地适应特定场景的需求，从而提供更精准、更个性化的服务。例如，一个通用的大语言模型通过微调，可以成为医疗领域的专业问答系统，或金融行业的风险分析工具。这正是AI技术走向垂直化、专业化的重要途径，也催生了众多细分领域的创新应用。

生成对抗网络（GAN）

生成对抗网络，简称GAN，是一种机器学习框架，它支撑了生成式AI在产生真实数据方面的一些重要发展，包括（但不限于）深度伪造工具。GANs涉及使用一对神经网络，其中一个（生成器）根据其训练数据生成输出，然后将输出传递给另一个模型（判别器）进行评估。这个判别器模型扮演着对生成器输出进行分类的角色，从而使生成器能够随着时间的推移而改进。GAN的结构被设置为一种竞争（因此被称为“对抗性”），两个模型基本上被编程为试图超越对方：生成器试图让其输出通过判别器，而判别器则努力识别出人工生成的数据。这种结构化的竞争可以优化AI输出，使其更加真实，而无需额外的人工干预。尽管GANs最适用于狭窄的应用（例如生成逼真的照片或视频），而不是通用AI。GANs的出现，极大地丰富了AI在艺术创作、数据增强等方面的应用，但也带来了如何辨别真伪、防止滥用等伦严峻挑战。

幻觉

“幻觉”，这是AI行业用来描述AI模型“凭空捏造”信息的术语——即生成不正确的信息。很显然，这对于AI的质量来说是一个巨大的问题。AI产生的“幻觉”输出可能会误导用户，甚至可能导致现实生活中的风险，带来潜在的危险后果（想象一下，一个健康咨询返回了有害的医疗建议）。这也是为什么大多数生成式AI工具的免责声明中都会警告用户核实AI生成的答案，尽管这些免责声明通常远不如工具一键生成的信息那么显眼。AI编造信息的问题，据认为是由于训练数据中的空白所导致的。对于通用生成式AI，有时也称为基础模型，这个问题似乎难以彻底解决。目前存在的数据量，不足以训练AI模型全面回答我们可能提出的所有问题。一言以蔽之：我们尚未“创造”出“全知全能之神”（至少目前还没有）。“幻觉”问题正推动AI向越来越专业化和/或垂直化的模型发展——即需要更狭窄专业知识的领域特定AI——以此来减少知识空白和信息风险的可能性。新媒网跨境认为，解决AI幻觉问题，关键在于提升数据质量、优化模型架构以及开发更可靠的验证机制，同时，用户在使用AI生成内容时，保持批判性思维和验证习惯也同样重要。

推理

推理，指的是运行一个AI模型的过程。它是让模型“自由发挥”，根据之前看到的数据做出预测或得出结论。需要明确的是，推理离不开训练；模型必须在一组数据中学习模式，才能有效地从这些训练数据中进行推断。许多类型的硬件都可以执行推理，从智能手机处理器到强大的GPU，再到定制设计的AI加速器。但并非所有硬件都能同样高效地运行模型。非常大的模型，在一台笔记本电脑上进行预测可能需要很长时间，而在配备高端AI芯片的云服务器上则能快速完成。AI推理的效率直接影响到用户体验和应用成本，因此，如何优化推理性能，是当前AI硬件和软件发展的重要方向。

大语言模型（LLM）

大型语言模型，简称LLM，是目前许多热门AI助手所使用的核心技术，比如美国的ChatGPT、美国的Claude、美国谷歌的Gemini、美国Meta的Llama系列AI模型、美国微软的Copilot，以及法国Mistral公司的Le Chat等。当你与这些AI助手进行对话时，你就是在与一个大型语言模型进行交互。这个模型会直接处理你的请求，或者借助网络浏览、代码解释器等不同的工具来提供帮助。AI助手和LLM可能拥有不同的名称，例如，GPT是美国OpenAI公司的大型语言模型，而ChatGPT则是其对应的AI助手产品。

LLM是由数十亿个数值参数（或称权重，见下文）组成的深度神经网络，它们通过学习词汇和短语之间的关系，构建出一种语言的表征——可以理解为一张多维的词语地图。这些模型是通过编码数十亿本书籍、文章和文字记录中发现的模式而创建的。当你向LLM提出一个问题或指令时，模型会生成最符合该提示的模式。然后，它会根据前面已生成的内容，评估最有可能出现的下一个词汇。这个过程不断重复，直至生成完整的回答。新媒网跨境了解到，LLM的发展极大地推动了人机交互的自然化，使得AI能够更好地理解人类意图，并在日常工作、学习和生活中扮演越来越重要的角色。

内存缓存

内存缓存，指的是一种能够显著提升AI推理过程效率的重要机制（推理是AI生成用户查询响应的过程）。从本质上讲，缓存是一种优化技术，旨在提高推理的效率。人工智能的运行无疑是由大量高强度数学计算驱动的，每一次计算都会消耗更多的算力。缓存的设计目的就是通过保存特定的计算结果，供未来用户查询和操作时重复使用，从而减少模型可能需要运行的计算次数。

内存缓存有多种类型，其中比较知名的一种是KV（键值）缓存。KV缓存在基于Transformer架构的模型中发挥作用，它通过减少生成用户问题答案所需的时间和算法工作量，从而提高效率，加速结果的产出。想象一下，AI在一次思考后，把一些关键的“中间结论”记下来，下次遇到类似问题时，可以直接从这些“结论”出发，而不用再从头开始推导，这样就能大大加快反应速度。这种优化对于提升AI应用的响应速度和用户体验至关重要。

神经网络

神经网络，是指支撑深度学习以及更广泛的生成式AI工具（在大语言模型出现后蓬勃发展）的多层算法结构。尽管从人类大脑密集互联的神经通路中汲取灵感，作为数据处理算法设计结构的想法可以追溯到上世纪40年代，但真正释放这一理论力量的，却是最近图形处理硬件（GPU）的兴起——这主要得益于视频游戏产业的发展。

这些芯片被证明非常适合训练比早期时代多得多的层级算法，使得基于神经网络的AI系统在语音识别、自动导航和药物发现等许多领域都取得了远超以往的性能。神经网络通过模拟大脑的工作方式，让机器具备了从大量数据中学习和识别复杂模式的能力，是现代人工智能技术的核心驱动力。它的不断演进，预示着AI在更多领域取得突破的可能性。

内存芯片荒（RAMageddon）

“内存芯片荒”这个词，带着几分戏谑，却形象地描绘了当前科技界一个令人头疼的趋势：随机存取存储器（RAM芯片）的短缺日益加剧。RAM芯片几乎为我们日常使用的所有科技产品提供动力。随着人工智能产业的蓬勃发展，全球最大的科技公司和AI实验室为了争夺最强大、最高效的AI能力，正在大量采购RAM芯片来支撑他们的数据中心，以至于留给其他行业的产品所剩无几。这种供应瓶颈意味着，剩余的RAM芯片价格越来越昂贵。

受此影响的行业包括游戏（主要公司不得不提高游戏机价格，因为更难找到用于其设备的存储芯片）、消费电子产品（内存短缺可能导致智能手机出货量出现十多年来的最大跌幅），以及普通企业计算（因为这些公司无法为其自身的数据中心获得足够的RAM）。预计价格的飙升只有在可怕的短缺结束后才会停止，但不幸的是，目前没有太多迹象表明这种情况会很快发生。新媒网跨境认为，这场“内存芯片荒”凸显了全球供应链的脆弱性以及关键技术资源的战略重要性，促使各国和企业更加重视供应链韧性和本土化生产能力的建设。

训练

开发机器学习AI涉及一个被称为“训练”的过程。简单来说，它指的是将数据输入模型，以便模型能够从中学习模式并生成有用的输出。在这个AI技术栈的环节，事情可能会变得有些哲学——因为在预训练之前，用作开发学习系统起点的数学结构只是一堆层和随机数。只有通过训练，AI模型才真正成形。

本质上，它是系统响应数据特征的过程，使其能够根据预设目标调整输出——无论是识别猫的图像，还是按需生成一首俳句。值得注意的是，并非所有AI都需要训练。那些被编程遵循手动预定义指令的基于规则的AI——例如线性聊天机器人——不需要经过训练。然而，这种AI系统可能比（训练有素的）自学习系统受到更多限制。

尽管如此，训练可能成本高昂，因为它需要大量的输入——而且，通常来说，这种模型所需的输入量一直在增加。有时可以采用混合方法来缩短模型开发时间并帮助管理成本。例如，对基于规则的AI进行数据驱动的微调，这意味着与从头开始构建相比，开发所需的数据、算力、能源和算法复杂性更少。AI训练的质量和效率，是决定AI模型性能和应用前景的关键因素，也是当前AI研发投入的重点。

令牌（Tokens）

在人机沟通方面，存在一些显而易见的挑战。人类使用自然语言进行交流，而AI程序则通过复杂的算法过程来执行任务和响应查询，这些过程都由数据驱动。从最简单的定义来看，“令牌”代表了人机沟通的基本组成部分，因为它们是已经被大型语言模型（LLM）处理或产生的离散数据段。

令牌是通过一个名为“分词”（tokenization）的过程创建的，该过程将原始数据分解并提炼成LLM可消化的独立单元。类似于软件编译器将人类语言翻译成计算机可消化的二进制代码，分词过程通过用户查询，为人机交互中的AI程序解释人类语言，从而让AI程序能够准备响应。

令牌有几种不同类型，包括输入令牌（为响应人类用户查询而必须生成的类型）、输出令牌（LLM响应人类请求时生成的类型），以及推理令牌，这涉及到作为用户请求一部分的更长、更密集的任务和过程。在企业AI应用中，令牌的使用也决定了成本。由于令牌等同于模型处理的数据量，它们也成为了AI行业对其服务进行货币化的方式。大多数AI公司按每令牌收费来收取LLM使用费。因此，企业在使用AI程序（例如美国的ChatGPT）时消耗的令牌越多，就必须向其AI服务提供商（例如美国OpenAI公司）支付越多的费用。这使得令牌成为衡量AI服务价值和成本的关键指标。

迁移学习

迁移学习是一种技术，它将一个已经训练过的AI模型作为起点，用于开发一个针对不同但通常相关任务的新模型——这使得在先前训练周期中获得的知识可以被重新应用。迁移学习可以通过缩短模型开发时间来提高效率，特别是在为模型开发的新任务数据相对有限时，这种方法也十分有用。

但需要注意的是，这种方法也有其局限性。依赖迁移学习获得通用能力的模型，很可能需要针对其关注领域的数据进行额外的训练，才能在该领域表现良好。例如，一个在大量通用文本上训练过的语言模型，可以迁移到医学领域，但为了在诊断或专业文献分析上表现出色，仍需用特定的医学数据进行微调。迁移学习极大地降低了AI开发的门槛和成本，使得更多的个人和中小企业能够利用已有的AI模型，快速构建自己的智能应用，是推动AI普惠化发展的重要力量。

权重

“权重”是AI训练的核心要素，它们决定了数据中不同特征（或输入变量）在训练系统中被赋予多少重要性，从而塑造了AI模型的输出。换句话说，权重是数值参数，它们定义了在给定训练任务中数据集中最重要的部分。它们通过对输入进行乘法运算来发挥作用。

模型训练通常从随机分配的权重开始，但随着训练过程的展开，当模型寻求达到与目标更匹配的输出时，权重会进行调整。例如，一个用于预测房价的AI模型，如果用目标地点的历史房地产数据进行训练，可能会包括卧室数量、浴室数量、物业是独立式还是半独立式、是否有停车位、车库等特征的权重。最终，模型赋予这些输入中的每一个的权重，反映了它们根据给定数据集对物业价值的影响程度。权重就像AI模型在学习过程中逐渐形成的“经验法则”，通过不断调整，让模型能够更准确地理解和预测复杂现象。

新媒网（公号: 新媒网跨境发布），是一个专业的跨境电商、游戏、支付、贸易和广告社区平台，为百万跨境人传递最新的海外淘金精准资讯情报。

本文来源：新媒网 https://nmedialink.com/posts/ai-devours-ram-chips-tech-shock-price-hike.html