V4-ProCodeforces3206压GPT-5.4登顶，但长上下文和知识仍输Opus与Gemini

2026-04-24 12:11:53 分类：资讯 | 知识库 | 快讯

币界网消息，V4-Pro在Codeforces上获得3206分，超过GPT-5.4的3168分和Gemini 3.1 Pro的3052分，刷新了该基准纪录。技术报告显示，V4-Pro在编码方面表现优异，但在长上下文和知识密集型评测上仍落后于Opus和Gemini。具体而言，V4-Pro在CorpusQA 1m基准得分62.0，落后Opus 4.6的71.7，MRCR 1m得分83.5，Opus 4.6以92.9领先近10个百分点。需要注意的是，以上对比不含最近发布的GPT-5.5和Opus 4.7，V4与最新闭源模型的差距有待进一步验证。

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时间联系我们修改或删除，多谢。