OpenAI的GPT-5翻车?性能波动大,紧急修复后能否稳住AI霸主地位?
当地时间2025年5月9日,OpenAI最新一代人工智能模型GPT-5正式向公众开放。这款被公司首席执行官Sam Altman数月来持续造势的AI产品,在发布首日却遭遇口碑分化。新媒网跨境获悉,这款标榜具备"博士级专业水平"的模型,在实际应用中展现出明显的性能波动。
OpenAI在发布声明中强调,GPT-5在代码编写和复杂问题推理方面取得突破性进展。开发者Simon Willison在其技术博客中评价该模型"表现出色且偶有惊艳",但同时指出其核心框架与前代产品差异有限。而来自本特利大学的数学副教授Noah Giansiracusa则直言,GPT-5的性能提升幅度低于预期。
技术架构的特殊性可能是争议的根源。GPT-5采用动态模型切换机制,系统会根据查询复杂度自动调用不同层级的运算模型。这一设计虽然能优化计算资源配置,但导致用户体验出现显著波动。例如在测试案例中,GPT-5初次回答"blueberry"包含字母"b"的数量时给出错误答案,经提示后启动高级推理模块才得出正确结论。
新媒网跨境了解到,Altman在社交媒体平台Reddit举行的问答活动中承认系统存在技术缺陷。他表示,由于自动切换功能在发布当日出现故障,导致部分时段的模型性能表现异常。公司已进行紧急修复,并承诺将增强模型调用机制的透明度。
性能评估方面呈现矛盾结果。在LMArena平台用户评分体系中,GPT-5在多个评估类别位居榜首;但根据ARC-AGI-2基准测试显示,其综合表现落后于埃隆·马斯克旗下xAI公司的最新产品Grok。宾夕法尼亚大学沃顿商学院教授Ethan Mollick通过实践测试指出,该模型在学术研究、创意写作和编程辅助方面展现出独特价值。
商业背景层面,OpenAI正面临中美两国AI企业的激烈竞争。自2023年推出ChatGPT引爆生成式AI浪潮以来,该公司持续加大在人才储备、芯片采购和数据中心建设方面的投入。GPT-5的商业化表现将直接影响其能否继续保持行业领先地位。
用户反馈呈现两极分化趋势。在Reddit平台的讨论中,部分用户对模型切换机制缺乏透明度表示不满,也有专业用户肯定其在特定场景下的卓越表现。OpenAI表示将持续收集使用数据以优化产品体验,预计完整评估需要更长时间的市场验证。
新媒网(公号: 新媒网跨境发布),是一个专业的跨境电商、游戏、支付、贸易和广告社区平台,为百万跨境人传递最新的海外淘金精准资讯情报。

评论(0)