币界网消息,V4-Pro在Codeforces上获得3206分,超过GPT-5.4的3168分和Gemini 3.1 Pro的3052分,刷新了该基准纪录。技术报告显示,V4-Pro在编码方面表现优异,但在长上下文和知识密集型评测上仍落后于Opus和Gemini。具体而言,V4-Pro在CorpusQA 1m基准得分62.0,落后Opus 4.6的71.7,MRCR 1m得分83.5,Opus 4.6以92.9领先近10个百分点。需要注意的是,以上对比不含最近发布的GPT-5.5和Opus 4.7,V4与最新闭源模型的差距有待进一步验证。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。
