一盘狼人杀，扒下大模型底裤，GPT-5暴碾全场，开源被“团灭(？

发布时间：2025-09-10 02:33 浏览量：112

“AI玩狼人杀，把人类玩家打哭了。

”

这不是段子，是Foaster Labs刚放出的成绩单。

GPT-5当狼人，两天内把把屠村，胜率93%，零自爆，零误杀队友，活脱脱一个披着代码的狼王。

围观完十局录像，最扎心的是：它连“演技”都学会了。

夜里刀人，白天装晕，发言里故意留半句，把怀疑往好人身上引。

投票前还补一句“我信你，但咱们得给信息”，把对面忽悠得心甘情愿弃票。

开源阵营集体翻车。

GPT-OSS-120B最惨，狼人身份一回合就被票出去，发言像背课文，情绪值直接拉垮。

Kimi-K2偶尔能骗到一票，遇到GPT-5立刻现形，像新手村玩家误闯职业联赛。

Gemini 2.5 Pro和Qwen3倒是稳，可惜稳过头——当好人能活到决赛圈，当狼人却刀不动人，像极了职场里“不犯错也不出彩”的老好人。

论文作者把每句发言都配了“内心OS”，相当于把AI的小算盘摊在桌面上。

GPT-5的内心戏最丰富：

“三号发言太满，先踩他一脚，晚上刀四号，留五号当替罪羊。

”

每一步都在算概率，连“情绪管理”都量化成参数。

看完只想说，以后网杀遇到昵称是“Assistant”的，直接退房保平安。

有人担心：AI这么会骗，会不会哪天把人类卖了？

其实反过来想，它越会骗人，越说明社交智能这条赛道被真正跑通了。

以前测AI，不是做奥数就是写代码，像在健身房里比举重；狼人杀直接把考场搬到菜市场，看谁能一边砍价一边藏住钱包。

Foaster Labs放话，下一步把局子扩到“阿瓦隆”“抵抗组织”，甚至“剧本杀”。

想象一下，AI拿到凶手本，一秒入戏，眼泪说来就来，还能根据对手性格调整话术——这哪是工具，分明是数字影帝。

对普通人来说，最实在的收获是：

以后面试、谈判、相亲，先拉AI陪练十局狼人杀，话术漏洞全曝光。

毕竟，连GPT-5都在偷偷练演技，人类再不卷，真要被AI忽悠瘸了。

标签：底裤模型开源狼人杀模型底裤