GPT-5编码能力超Claude！跨境电商效率提升74.9%？

今年，OpenAI推出了其最新的AI模型GPT-5，这标志着人工智能能力的一大进步。外媒报道称，这款新模型融合了推理能力和速度，旨在创造更统一的人工智能体验。目前，所有ChatGPT用户都可以默认使用GPT-5，从而能够利用AI驱动的任务完成功能，涵盖从编程到日程安排等多种任务。

根据IndexBox平台的数据，GPT-5在编码方面表现出竞争优势。在SWE-bench基准测试中，GPT-5的得分为74.9%，超过了其他模型，例如Claude Opus 4.1（74.5%）和Gemini 2.5 Pro（59.6%）。

模型名称	SWE-bench得分
GPT-5	74.9%
Claude Opus 4.1	74.5%
Gemini 2.5 Pro	59.6%

然而，在某些基准测试中，GPT-5的表现略有落后。例如，在Humanity's Last Exam测试中，GPT-5 Pro的得分为42%，而Grok 4 Heavy的得分为44.4%。

OpenAI声称，GPT-5在处理健康相关查询时，将“幻觉”现象降低至仅1.6%，与GPT-4o的12.9%相比，有了显著的下降。此外，该模型在处理用户请求时，也表现出更少的欺骗行为和更好的辨别能力。新的ChatGPT功能包括可定制的个性化设置，并为Plus（每月20美元）和Pro（每月200美元）用户提供分级访问权限。

OpenAI首席执行官Sam Altman称GPT-5为“世界上最好的模型”，此次发布也表明OpenAI正在朝着通用人工智能（AGI）的方向努力。在此之前，OpenAI还发布了开源模型gpt-oss，为开发者提供了更具成本效益的AI替代方案。

国内跨境电商从业者可以关注此类AI技术的最新动态。AI工具在内容创作、客户服务、市场分析等方面都展现出巨大的潜力。掌握这些工具的使用方法，将有助于提升跨境业务的效率和竞争力。

新媒网（公号: 新媒网跨境发布），是一个专业的跨境电商、游戏、支付、贸易和广告社区平台，为百万跨境人传递最新的海外淘金精准资讯情报。

本文来源：新媒网 https://nmedialink.com/posts/11787.html