亚马逊云科技Bedrock再添五款开放模型,加速全球AI创新!
2025年,亚马逊云科技(AWS)在人工智能领域持续投入,进一步巩固其作为开放权重模型运行平台的地位。亚马逊云科技近期宣布,其Amazon Bedrock平台新增了五款开放权重模型,其中包括来自中国科技巨头阿里巴巴的通义千问Qwen3系列模型以及DeepSeek-V3.1模型,这些新模型现已在全球范围内全面托管上线,为全球客户提供了更加丰富的模型选择,以满足多元化的业务需求。
新媒网跨境获悉,此举不仅拓展了Amazon Bedrock上已有的多样化开放权重模型库,也包括来自Meta、Mistral AI以及近期整合的OpenAI模型,更凸显了亚马逊云科技致力于提供前沿人工智能技术的承诺。通过此举,客户能够在广泛的模型选择中,根据具体的应用场景挑选最适合的模型,同时全面享受亚马逊云科技在安全性、隐私保护和可靠性方面的优势。
亚马逊云科技的战略布局与模型特性
在人工智能模型的选择上,亚马逊云科技始终秉持为客户提供专有模型与开放权重模型并重的策略。这种多元化选择被认为是释放生成式人工智能创新潜力的关键。开放权重模型的一大显著特点是其开发者可以更深入地了解模型的内在运作机制,这不仅增强了客户对模型的定制能力,也有效促进了技术创新,并在一定程度上优化了成本效益。
目前,Amazon Bedrock平台的用户在使用这些模型时,能够享受企业级的安全保障,这包括数据加密和严格的访问控制,从而有效帮助客户维护数据隐私并符合各项合规要求。亚马逊云科技明确表示,客户对其数据的控制权是完全独立的,这意味着亚马逊云科技不会与模型提供商共享客户的模型输入和输出数据,这些数据也不会被用于改进基础模型。此外,客户还可以配置如Amazon Bedrock Guardrails等安全护栏,这些由亚马逊云科技推荐的功能旨在检测和预防模型可能产生的“幻觉”(即生成不准确或不相关的信息)。
与此同时,亚马逊云科技在硬件层面的创新也在同步推进。名为“Project Rainier”的独特AI计算集群,将连接数十万个Trainium2芯片,旨在构建下一代人工智能的基础设施。这些芯片协同工作,为运行包括最新开放权重模型在内的复杂AI任务提供强大算力支持。
通义千问Qwen3系列模型深度解析
此次加入Amazon Bedrock的通义千问Qwen3系列包含了四款全新的开放权重模型,它们在功能上展现出高度的灵活性和强大的处理能力。这些模型能够规划多步骤工作流程,与各种工具和API无缝集成,并处理单一任务中的长上下文窗口。其中两款通用模型还提供了“思考”与“非思考”两种推理模式,以适应不同的计算需求和应用场景。
Qwen3模型的突出优势还体现在其多语言能力上,尤其在中文和英文方面的表现尤为出色,这使得它能够支持跨文化业务运营和高效的内容生成,对于全球化企业具有重要意义。
具体来看,Qwen3系列中的两款编码优化模型具备卓越的软件工程能力:
- Qwen3-Coder-480B-A3B-Instruct 和 Qwen3-Coder-30B-A3B:这两款模型专为复杂的软件工程场景设计,涵盖代码生成、代码理解以及高级代理任务。它们能够用多种编程语言编写代码,并自主利用外部工具和应用程序,极大地提升了开发效率和自动化水平。
另外两款通用型模型则兼顾了能力与效率:
2. Qwen3-235B-A22B-Instruct-2507:这是一款为通用推理任务而设计的模型,在编码、数学和通用推理任务中都表现出具有竞争力的性能。该模型采用“专家混合”(MoE)架构,其特点是在处理每个请求时,仅激活部分参数。这意味着模型只会调用其知识库中的相关部分来应对特定任务或问题,从而在保证高性能的同时,显著提升了运行效率。
3. Qwen3-32B (Dense):这款“密集型”模型适用于计算资源有限的场景,或需要稳定可预测性能的应用。与MoE模型不同,密集型模型通常规模较小,其所有组成部分都在任何时候协同工作,更像一个紧密合作的团队,而非各司其职的专业部门。
DeepSeek-V3.1模型核心优势
DeepSeek-V3.1作为DeepSeek模型的最新版本,提供了独特的混合推理能力,有效平衡了快速响应与深度透明的思考过程。
客户可以在两种模式之间进行切换:一种是“思考模式”,它会逐步仔细地解决问题,提供详尽的推理过程;另一种是“快速响应模式”,适用于更直接的问题。这种设计不仅提升了模型的实用性,也增加了决策过程的可见性。
这款高度复杂的模型与目前市场上一些最先进的人工智能系统不相上下。值得一提的是,DeepSeek-V3.1同样采用了MoE架构,这意味着客户在享受其强大性能的同时,还能有效优化计算成本。
DeepSeek-V3.1同样具备多语言处理能力,并且特别擅长软件开发、数学推理和数据分析,在编码和技术挑战方面表现卓越。此外,它也非常适合代理式问题解决任务,例如构建AI代理和实现流程自动化。
亚马逊云科技的硬件创新也支撑着其在AI领域的布局,例如其Annapurna Labs的Trainium2芯片,这些芯片是AI计算微观世界的“城市”,24小时不间断地进行高速计算和数据传输。
亚马逊云科技对开放模型策略的阐释
亚马逊云科技Amazon Bedrock总监Luis Wang表示:“开放权重模型代表了人工智能创新领域的一个重要前沿,因此我们投入巨资,将亚马逊云科技打造成一个能够安全、大规模且经济高效地运行这些模型的最佳平台。”他进一步指出,并不认为存在一个能够适用于所有用例的最佳模型。许多客户喜欢使用开放模型,其中一个显著的好处是拥有更大的灵活性来对其进行探索和定制。
为了更形象地说明这些模型的特性,可以将Qwen3-Coder模型比作那些能耐心遵循复杂家具组装说明的朋友,他们可以将一堆零件变成一个完美组装的书柜,并清晰地解释每一步。而通用型的Qwen3模型则像一个多才多艺、精通多种语言的大家庭,他们能够流利地说几十种语言,并拥有百科全书般的知识储备,从解释科学概念到创作富有想象力的故事,无所不能。他们能够就几乎任何话题进行深入交流,并记住过往对话中的每一个细节。
如果将DeepSeek-V3.1拟人化,它就像一个擅长解决问题的朋友,能够通过逻辑推理系统地分解挑战,并根据问题的复杂性灵活调整其处理方法。
关键数据与行业影响
在模型性能方面,新媒网了解到,数据指标展现了这些模型的强大能力:
- Qwen3-Coder-30B-A3B-Instruct 和 Qwen3-235B-A22B-Instruct-2507 模型能够一次处理多达26.2万个token。这个处理量相当于大约20万个单词,或在一次对话中处理两部完整长度的小说,这对于需要处理大量文本数据的应用来说至关重要。
- DeepSeek-V3.1 拥有6850亿参数。参数是模型的“知识连接”,是模型在训练过程中根据数据进行调整的内部数值设置,以帮助其学习和预测。DeepSeek-V3.1的优势在于它只使用其知识库中与每个任务相关的部分,这使其在提供强大性能的同时,运行成本更为高效。
据一家名为“Artificial Analysis”的专业分析机构报告,DeepSeek-V3.1在推理和代理技能方面比其前身有显著改进。
目前,已有客户开始受益于Amazon Bedrock上的DeepSeek模型。例如,加密货币市场数据源CoinMarketCap一直在使用DeepSeek-R1(DeepSeek系列的早期版本)将其网站上的海量加密货币数据转化为有价值的洞察,以服务其用户群体。
开放权重模型的深远意义
开放权重模型代表了人工智能在透明度和灵活性方面的一大进步。可以将其类比为一种汤底:虽然现有风味本身已经很美味,但厨师可以在此基础上添加额外的食材,以增加汤的深度和复杂性。同样地,客户可以审视模型的“配方”,根据自身需求进行调整,甚至在此基础上进行创新。从这个角度看,开放权重模型正在从几个重要方面重塑生成式人工智能的未来:
- 它们通过允许客户在现有工作基础上进行构建,而不是从零开始,从而极大地促进了创新。
- 对AI学习知识的深入理解有助于提高客户对模型的透明度。
- 当作为Amazon Bedrock中的完全托管模型提供时,即使是没有专业技术团队的组织也能够轻松访问和使用它们。
亚马逊云科技也致力于通过提供免费或低成本的AI/ML课程,帮助更多人掌握生成式AI的使用技能。目前,超过135门涵盖不同经验水平的AI/ML培训课程已向公众开放。
展望未来
亚马逊云科技坚信,为客户提供多样化的人工智能模型是释放生成式人工智能全部潜力的关键。例如,不久前亚马逊云科技将OpenAI的开放权重模型引入Amazon Bedrock,而2025年,亚马逊云科技正将这些模型的可用性扩展到全球所有拥有亚马逊云科技区域的大陆,包括美国东部(北弗吉尼亚)、美国西部(俄勒冈)、亚太地区(东京)、亚太地区(孟买)、欧洲(爱尔兰)、欧洲(伦敦)、欧洲(米兰)、欧洲(斯德哥尔摩)以及南美洲(圣保罗)。
随着越来越多强大的开放权重模型通过Amazon Bedrock等服务变得触手可及,那些不具备专业AI技术专长的组织也能够实施过去只有拥有大量技术资源和基础设施的机构才能实现的解决方案。这一趋势有望加速医疗保健、金融服务、制造业以及无数其他行业的创新,从而实现更精密的自动化工作流程、科学研究辅助、复杂的数学分析和业务流程优化。
新媒网(公号: 新媒网跨境发布),是一个专业的跨境电商、游戏、支付、贸易和广告社区平台,为百万跨境人传递最新的海外淘金精准资讯情报。
本文来源:新媒网 https://nmedialink.com/posts/aws-bedrock-adds-5-open-models-boosts-global-ai.html

评论(0)