大模型实时打《街霸》捉对PK，GPT-4居然不敌3.5，新型Benchmark火了

2024-07-04 04:57:27 分类：热点阅读(524)

让大模型直接操纵格斗游戏《街霸》里的大模敌新角色，捉对PK，型实型谁更能打?时打GitHub上一种你没有见过的船新Benchmark火了。与llmsys大模型竞技场中，街霸T居两个大模型分别输出答案，捉对再由人类评分不同——街霸Bench引入了两个AI之间的大模敌新交互，且由游戏引擎中确定的型实型规则评判胜负。这种新玩法吸引了不少网

......

本文由CSS站长资源合作伙伴自媒体作者“量子位公众号”授权发布于CSS站长资源平台，时打本平台仅提供信息索引服务。街霸T居由于内容发布时间超过平台更新维护时间，捉对为了保证文章信息的大模敌新及时性，内容观点的型实型准确性，平台将不提供完全的时打内容展现，本页面内容仅为平台搜索索引使用。街霸T居需阅读完整内容的捉对用户，请查看原文，获取内容详情。

即将跳转到外部网站安全性未知，是否继续继续前往

未经允许不得转载：>以辞害意网 » 大模型实时打《街霸》捉对PK，GPT-4居然不敌3.5，新型Benchmark火了

以辞害意网

大模型实时打《街霸》捉对PK，GPT-4居然不敌3.5，新型Benchmark火了

相关推荐

站长推荐

最新发布

分城市

友情链接

回顶部