2千万训4千亿AI！永久开源战Llama

当前全球人工智能领域正经历着前所未有的快速发展，特别是大型语言模型（LLM）的进步，持续吸引着业界的高度关注。在这一波技术浪潮中，开源模型扮演着日益重要的角色，它们不仅降低了技术门槛，也促进了全球范围内的创新与协作。许多行业观察者认为，未来AI模型市场的主导者将是少数几家科技巨头及其合作的头部模型研发机构。然而，一些新兴力量正以其独特的创新路径，向现有格局发起挑战。

近日，一家名为美国Arcee AI的初创公司，其仅有30名员工，却成功发布了一款名为Trinity的通用基础模型。这款模型以其完全且永久开源（采用Apache许可证）的特性引人注目。美国Arcee AI公司宣称，Trinity模型拥有4000亿个参数，是美国公司迄今为止训练和发布的最大规模开源基础模型之一。根据其基准测试结果（在仅进行少量后训练的基模型上进行），Trinity在性能上与美国Meta公司的Llama 4 Maverick 400B模型，以及中国清华大学Z.ai GLM-4.5等高性能开源模型不相上下。
Arcee CTO Lucas Atkins, CEO Mark McQuade

这份测试结果显示，Trinity的基础模型在编码、数学、常识、知识和推理等多个测试中表现出色，某些方面甚至略优于美国Meta公司的Llama模型。这无疑展示了美国Arcee AI公司在成为具有竞争力的AI实验室方面所取得的显著进展。 Trinity模型的发布，是继2025年12月该公司推出两款小型模型之后的又一重要里程碑：260亿参数的Trinity Mini，这是一款经过全面后训练的推理模型，适用于从网络应用到智能代理等多种任务；以及60亿参数的Trinity Nano，一款实验性模型，旨在探索如何在小型模型中实现出色的对话能力。

如同其他领先的AI模型，Trinity主要面向编码和多步骤处理任务，例如构建智能代理。然而，尽管其规模庞大，但目前它仅支持文本模式，尚未达到多模态的先进水平。美国Arcee AI公司首席技术官卢卡斯·阿特金斯（Lucas Atkins，上图左侧所示）向外媒透露，目前视觉模型正在开发中，而语音转文本版本也已列入研发路线图。相比之下，美国Meta公司的Llama 4 Maverick模型已经具备多模态能力，支持文本和图像。美国Arcee AI公司表示，在增加更多AI模式之前，他们希望首先拥有一个能够打动其主要目标客户——开发者和学者——的基础大型语言模型。

美国Arcee AI公司创始人兼首席执行官马克·麦奎德（Mark McQuade，上图右侧所示）表示，公司在短短六个月内，仅花费2000万美元，利用2048块美国英伟达公司Blackwell B300 GPU，完成了Trinity系列所有模型的训练。这笔投入来源于公司迄今为止筹集的约5000万美元资金。卢卡斯·阿特金斯作为模型构建工作的负责人，承认这笔费用对公司而言数额不小，但与其他大型实验室当前的投入相比，仍显相形见绌。他指出，六个月的开发周期是“经过精心计算的”。卢卡斯·阿特金斯在进入LLM领域之前，曾从事汽车语音助手开发工作，他强调：“我们是一家非常年轻且充满渴望的初创公司。我们拥有大量才华横溢、充满活力的年轻研究员，当获得这笔资金和训练这种规模模型的机会时，我们相信他们会挺身而出。他们也确实做到了，经历了无数个不眠之夜和长时间的工作。”
Arcee AI benchmarks for Trinity LLM

马克·麦奎德曾是开源模型交易平台美国HuggingFace的早期员工。他提到，美国Arcee AI公司最初的定位并非要成为一家新的AI实验室。公司初期主要为SK Telecom等大型企业客户提供模型定制服务。麦奎德解释说：“我们当时只做后训练。我们会利用其他公司的优秀成果，比如美国Meta公司的Llama模型、法国Mistral AI公司的Mistral模型，或者中国阿里的Qwen模型等开源模型，然后进行后训练，以使其更好地满足客户的特定应用需求，这其中也包括强化学习。”

然而，随着客户群的不断扩大，卢卡斯·阿特金斯表示，拥有自己的模型变得日益必要。马克·麦奎德也对过度依赖其他公司的技术感到担忧。与此同时，当时许多最优秀的开源模型来自中国，这使得一些美国企业在使用时有所顾虑，甚至受到限制。这是一个充满挑战的决定。马克·麦奎德坦言：“全球范围内，预训练并发布达到美国Arcee AI公司所设定规模和水平的模型的公司，可能不足20家。”公司最初从小型项目入手，与数据训练公司DatologyAI合作，尝试开发了一个45亿参数的小型模型。该项目的成功进一步鼓舞了公司向更大规模模型的研发迈进。

那么，既然美国已经拥有了Llama这样的开源模型，为什么还需要另一个呢？卢卡斯·阿特金斯解释称，美国Arcee AI公司选择开源Apache许可证，旨在承诺其模型将始终保持开放。这一举措的背景是，美国Meta公司首席执行官马克·扎克伯格在去年（2025年）曾表示，该公司可能不会将其所有最先进的模型都保持开源。

卢卡斯·阿特金斯认为：“Llama模型并非真正意义上的开源，因为它使用了由美国Meta公司控制的许可协议，其中包含商业和使用限制。”这导致一些开源组织声称Llama模型并不完全符合开源标准。马克·麦奎德强调：“美国Arcee AI公司的存在，正是因为美国需要一个永久开放、采用Apache许可证、能够真正在当今前沿领域竞争的顶级替代方案。”

美国Arcee AI公司的所有Trinity模型，无论大小，均可免费下载使用。最大版本的Trinity模型将以三种不同的形式发布：

Trinity Large Preview： 这是一个经过轻度后训练的指令遵循模型，这意味着它经过训练，可以遵循人类指令，而不仅仅是预测下一个词，使其适用于通用聊天用途。
Trinity Large Base： 这是未经任何后训练的基础模型。
TrueBase： 这是一个不包含任何指令数据或后训练的模型，旨在让企业或研究人员能够完全自定义，而无需移除任何预设数据、规则或假设。

美国Arcee AI公司未来还将提供其通用发布模型的托管版本，并计划提供具有竞争力的API定价。随着公司继续改进模型的推理训练，这一版本预计将在未来六周内发布。目前，Trinity-Mini的API定价为每千令牌输入0.045美元，每千令牌输出0.15美元，并且还提供限速的免费试用层级。与此同时，公司仍然提供后训练和定制化服务。

对中国的跨境行业从业者而言，美国Arcee AI公司此类创新型企业的崛起，以及其在开源大型语言模型领域的投入，传递出多重信号。全球AI技术竞争日益激烈，开源模型的开放性与许可协议的透明度，已成为影响企业选择和技术生态建设的关键因素。关注这些新兴力量在技术路径、商业模式以及开源策略上的探索，有助于我们更全面地理解全球AI发展格局。

对于国内跨境电商、智能制造、金融科技等领域的相关从业人员而言，持续关注海外AI前沿技术的动态至关重要。开源模型的多元化选择，意味着企业在构建自身AI应用时，拥有了更多灵活、自主的选项。无论是评估技术选型、优化产品服务，还是寻求国际合作机会，深入了解这些前沿进展，都将为我们的国际化发展提供宝贵的参考和支撑。通过持续学习和适应，中国企业有望在全球AI浪潮中占据更有利的位置，不断提升国际竞争力。

新媒网（公号: 新媒网跨境发布），是一个专业的跨境电商、游戏、支付、贸易和广告社区平台，为百万跨境人传递最新的海外淘金精准资讯情报。

本文来源：新媒网 https://nmedialink.com/posts/20m-trains-400b-ai-open-source-vs-llama.html