OpenAI的GPT-5翻车?性能波动大,紧急修复后能否稳住AI霸主地位?

2025-08-10人工智能

Image

当地时间2025年5月9日,OpenAI最新一代人工智能模型GPT-5正式向公众开放。这款被公司首席执行官Sam Altman数月来持续造势的AI产品,在发布首日却遭遇口碑分化。新媒网跨境获悉,这款标榜具备"博士级专业水平"的模型,在实际应用中展现出明显的性能波动。

OpenAI在发布声明中强调,GPT-5在代码编写和复杂问题推理方面取得突破性进展。开发者Simon Willison在其技术博客中评价该模型"表现出色且偶有惊艳",但同时指出其核心框架与前代产品差异有限。而来自本特利大学的数学副教授Noah Giansiracusa则直言,GPT-5的性能提升幅度低于预期。
OpenAI CEO Sam Altman

技术架构的特殊性可能是争议的根源。GPT-5采用动态模型切换机制,系统会根据查询复杂度自动调用不同层级的运算模型。这一设计虽然能优化计算资源配置,但导致用户体验出现显著波动。例如在测试案例中,GPT-5初次回答"blueberry"包含字母"b"的数量时给出错误答案,经提示后启动高级推理模块才得出正确结论。

新媒网跨境了解到,Altman在社交媒体平台Reddit举行的问答活动中承认系统存在技术缺陷。他表示,由于自动切换功能在发布当日出现故障,导致部分时段的模型性能表现异常。公司已进行紧急修复,并承诺将增强模型调用机制的透明度。

性能评估方面呈现矛盾结果。在LMArena平台用户评分体系中,GPT-5在多个评估类别位居榜首;但根据ARC-AGI-2基准测试显示,其综合表现落后于埃隆·马斯克旗下xAI公司的最新产品Grok。宾夕法尼亚大学沃顿商学院教授Ethan Mollick通过实践测试指出,该模型在学术研究、创意写作和编程辅助方面展现出独特价值。

商业背景层面,OpenAI正面临中美两国AI企业的激烈竞争。自2023年推出ChatGPT引爆生成式AI浪潮以来,该公司持续加大在人才储备、芯片采购和数据中心建设方面的投入。GPT-5的商业化表现将直接影响其能否继续保持行业领先地位。

用户反馈呈现两极分化趋势。在Reddit平台的讨论中,部分用户对模型切换机制缺乏透明度表示不满,也有专业用户肯定其在特定场景下的卓越表现。OpenAI表示将持续收集使用数据以优化产品体验,预计完整评估需要更长时间的市场验证。

新媒网(公号: 新媒网跨境发布),是一个专业的跨境电商、游戏、支付、贸易和广告社区平台,为百万跨境人传递最新的海外淘金精准资讯情报。

本文来源:新媒网 https://nmedialink.com/posts/12438.html

评论(0)

暂无评论,快来抢沙发~
OpenAI最新AI模型GPT-5正式发布,但首日口碑出现分化。该模型在代码编写和复杂问题推理方面有所突破,但性能表现存在波动,引发用户对模型切换机制的质疑。OpenAI承认存在技术缺陷并进行修复,同时面临中美AI企业竞争。
发布于 2025-08-10
查看人数 1632
人民币汇率走势
CNY
亚马逊热销榜
共 0 SKU 上次更新 NaN:NaN:NaN
类目: 切换分类
暂无数据
暂无数据
关注我们
新媒网跨境发布
本站原创内容版权归作者及NMedia共同所有,未经许可,禁止以任何形式转载。