DeepSeek R1仅560万!OpenAI怒控模型被‘蒸馏’

近日,全球人工智能领域再次迎来瞩目进展,一款由国内团队研发的AI模型 DeepSeek R1的发布,在业界引发了对AI技术发展路径和效率的深入探讨。其在性能表现和成本控制上的特点,不仅在技术层面带来了新的思考,也对全球科技市场产生了显著影响,促使行业重新审视AI研发的投入产出比。
外媒关注到,DeepSeek R1模型的面世,在一定程度上被认为展现出相较于部分海外同类产品更为经济且高效的特点。这一消息发布后,全球芯片制造巨头英伟达的股价在2025年曾出现波动,其市场价值一日内曾有较大调整,这在一定程度上反映了全球资本市场对AI技术创新与竞争格局的高度敏感。类似的市场动态,也影响了部分其他科技公司,并曾引发纳斯达克指数的相应变化。DeepSeek R1的出现,无疑为全球AI行业注入了新的活力,也促使各方更加关注如何实现技术突破与资源优化并举。
面对DeepSeek R1的快速发展,美国人工智能公司OpenAI也发表了声明。OpenAI表示,他们注意到并正在审查有迹象表明DeepSeek可能不当“蒸馏”了其模型。这一表态,将AI领域的竞争从技术本身延伸到了知识产权和行业规范的层面。
这种指控,与此前一些创作者、作家和艺术家对OpenAI等AI开发商提出的主张有相似之处。这些创作者认为,AI开发者在训练模型时使用了他们的受版权保护的作品,这可能侵犯了他们的知识产权。例如,外媒于2023年就曾对OpenAI提起诉讼,此类案件目前仍在审理中,联邦法官正就版权法中的这一新兴问题进行探讨。这表明,随着AI技术的快速发展,全球范围内关于数据使用、知识产权保护和行业伦理的讨论日益增多,相关法律框架也在不断探索和完善中。
要理解这一争议,首先需要简要了解AI工具的开发原理。尽管AI聊天机器人看似能够独立思考并生成回应,但它们本质上并不直接“创造”内容。它们需要通过开发者将大量人类生产的内容——如书籍、新闻文章、网络抓取的数据等——注入数据库进行“训练”。
这些训练材料使AI模型能够通过生成文本模式,并重组从其庞大数据中提取的事实,从而对问题做出看似连贯的回答。面对版权侵权指控,AI公司通常会援引美国版权法中的“合理使用”原则进行辩护。根据美国版权局的定义,“合理使用”通常允许在未经许可的情况下使用受版权保护的材料,如果其目的是用于“批评、评论、新闻报道、教学、学术研究”等。然而,这一概念的定义较为模糊,通常由法官根据具体案件逐一裁定。
OpenAI对DeepSeek的指控则涉及一个在AI领域被称为“蒸馏”的过程。这意味着使用一个AI模型的输出来训练另一个AI模型,而不是像训练第一个模型那样,直接使用完整且庞大的原始数据库。这种方法在技术上具有一定创新性,但也引发了关于其合规性的讨论。
外籍学者加里·马库斯等AI观察人士指出,从某种程度上看,OpenAI可能也曾对其他内容来源做过类似DeepSeek被指控的事情。他认为,这是AI发展过程中一个值得深思的现象。OpenAI的一位发言人向外媒表示,他们意识到国内企业正在积极采用包括“蒸馏”在内的各种方法,试图复现先进的美国AI模型。该发言人强调:“我们注意到并正在审查有迹象表明DeepSeek可能不当‘蒸馏’了我们的模型。”不过,OpenAI并未就其自身是否也曾采取类似方法训练模型的问题做出直接回应。微软作为OpenAI的重要合作伙伴和投资者,也表示对此不予置评。DeepSeek公司目前也未对外媒的置评请求作出回应。
通常情况下,AI公司允许甚至鼓励开发者从其工具中“蒸馏”内容,并将其视为一种创收服务。但他们划清了界限,禁止将“蒸馏”用于生产或改进竞争产品,例如可能与OpenAI的ChatGPT模型构成竞争的DeepSeek R1。OpenAI认为,这种行为违反了其服务条款,因此指责DeepSeek进行了“不当蒸馏”。
这一事件再次将人们的目光引向了全球AI发展的宏观图景。DeepSeek R1的发布之所以引发如此关注,原因之一在于海外许多AI开发商的商业模式一直建立在投入近乎无限的资源,以追求未来愿景之上。这包括来自风险投资者和(在OpenAI案例中)微软的巨额资本、海量的能源消耗,以及英伟达越来越强大且昂贵的图形处理器。外籍行业观察人士埃德·齐特伦曾评论道:“许多美国科技巨头投入巨资,在庞大的数据中心和数以十亿计的英伟达GPU支持下,构建起更大、更复杂的模型,这种巨大的支出不仅给我们的电网带来压力,也消耗了我们的水资源,但似乎很少有人考虑过是否存在替代方案。”

在资金、能源和芯片供应相对充足的背景下,这些公司可能缺乏寻求更经济、更高效开发路径的动力。然而,DeepSeek似乎展现了以更低成本实现同样目标的可行性。DeepSeek声称其AI工具的开发成本低于560万美元,这一数字可能主要指模型训练阶段的投入,而此前的研发投入和母公司高飞基金的注资情况并未公开。此外,DeepSeek也提及其模型是利用英伟达芯片开发的,而这些芯片可能并非最新、最昂贵的版本,这或许与美国此前政府施加的先进芯片出口限制有关。即便面临技术上的约束,国内开发者仍能有效找到创新性的解决方案,这体现了其在技术攻关方面的韧性和实力。
DeepSeek AI工具的发布所引发的技术和商业思维变革,实际上也可能对全球AI产业带来积极影响。海外企业可能会面临来自投资者的压力,要求它们以更少的资源实现更多成果,而非一味地追求更多投入。这种对“降本增效”的强调,有望促使AI应用的成本降低,从而提升其对商业客户的吸引力。这至关重要,因为目前许多AI应用尚未找到不可替代的、且更具成本效益的商业场景。值得注意的是,DeepSeek并未完全解决OpenAI和其他开发公司在AI工具广泛应用中面临的核心障碍:即AI工具仍存在“幻觉”现象,即生成不准确信息的问题,这在一定程度上影响了其可靠性。
DeepSeek事件近期引发的震动,预计将在未来较长一段时间内持续发酵。它不仅促使行业反思迄今为止在AI领域投入的巨大资金是否都物有所值,也对“投入数百亿美元就能解决所有技术难题”的观点提出了挑战。对于AI技术及其推广价值的最终评判,行业仍需保持理性观察和持续探索。对于我国跨境行业的从业人员而言,密切关注全球AI技术的前沿进展、了解不同国家和地区在AI研发上的策略与挑战、以及知识产权保护和行业竞争的新动态,都将是至关重要的。这不仅有助于我们把握技术红利,提升自身业务的智能化水平,也能更好地在全球市场中进行战略布局,应对可能出现的机遇与挑战。
新媒网(公号: 新媒网跨境发布),是一个专业的跨境电商、游戏、支付、贸易和广告社区平台,为百万跨境人传递最新的海外淘金精准资讯情报。
本文来源:新媒网 https://nmedialink.com/posts/deepseek-r1-5-6m-cost-openai-distilled.html


粤公网安备 44011302004783号 













