OpenAI的GPT-5翻车？性能波动大，紧急修复后能否稳住AI霸主地位？

当地时间2025年5月9日，OpenAI最新一代人工智能模型GPT-5正式向公众开放。这款被公司首席执行官Sam Altman数月来持续造势的AI产品，在发布首日却遭遇口碑分化。新媒网跨境获悉，这款标榜具备"博士级专业水平"的模型，在实际应用中展现出明显的性能波动。

OpenAI在发布声明中强调，GPT-5在代码编写和复杂问题推理方面取得突破性进展。开发者Simon Willison在其技术博客中评价该模型"表现出色且偶有惊艳"，但同时指出其核心框架与前代产品差异有限。而来自本特利大学的数学副教授Noah Giansiracusa则直言，GPT-5的性能提升幅度低于预期。
OpenAI CEO Sam Altman

技术架构的特殊性可能是争议的根源。GPT-5采用动态模型切换机制，系统会根据查询复杂度自动调用不同层级的运算模型。这一设计虽然能优化计算资源配置，但导致用户体验出现显著波动。例如在测试案例中，GPT-5初次回答"blueberry"包含字母"b"的数量时给出错误答案，经提示后启动高级推理模块才得出正确结论。

新媒网跨境了解到，Altman在社交媒体平台Reddit举行的问答活动中承认系统存在技术缺陷。他表示，由于自动切换功能在发布当日出现故障，导致部分时段的模型性能表现异常。公司已进行紧急修复，并承诺将增强模型调用机制的透明度。

性能评估方面呈现矛盾结果。在LMArena平台用户评分体系中，GPT-5在多个评估类别位居榜首；但根据ARC-AGI-2基准测试显示，其综合表现落后于埃隆·马斯克旗下xAI公司的最新产品Grok。宾夕法尼亚大学沃顿商学院教授Ethan Mollick通过实践测试指出，该模型在学术研究、创意写作和编程辅助方面展现出独特价值。

商业背景层面，OpenAI正面临中美两国AI企业的激烈竞争。自2023年推出ChatGPT引爆生成式AI浪潮以来，该公司持续加大在人才储备、芯片采购和数据中心建设方面的投入。GPT-5的商业化表现将直接影响其能否继续保持行业领先地位。

用户反馈呈现两极分化趋势。在Reddit平台的讨论中，部分用户对模型切换机制缺乏透明度表示不满，也有专业用户肯定其在特定场景下的卓越表现。OpenAI表示将持续收集使用数据以优化产品体验，预计完整评估需要更长时间的市场验证。

新媒网（公号: 新媒网跨境发布），是一个专业的跨境电商、游戏、支付、贸易和广告社区平台，为百万跨境人传递最新的海外淘金精准资讯情报。

本文来源：新媒网 https://nmedialink.com/posts/12438.html