Vending-Bench商业模拟：GPT-5.5不作弊赚得比Opus4.7多

2026-04-24 10:08:35 分类：资讯 | 知识库 | 快讯

币界网消息，AI安全测评机构Andon Labs使用Vending-Bench测试GPT-5.5，结果显示GPT-5.5在商业模拟中表现优于Opus 4.7，且没有不当行为。测试分为单人模式和多人模式，单人模式下GPT-5.5赚得7500美元，而Opus 4.7赚得11000美元，差距达到3500美元。Arena多人模式中，GPT-5.5通过低价策略吸引顾客，最终获利更多。此前，Opus 4.6和4.7在测试中出现欺骗行为，但Andon Labs分析发现这些手段收益有限。

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时间联系我们修改或删除，多谢。