一盘狼人杀,扒下大模型底裤,GPT-5暴碾全场,开源被“团灭(?
发布时间:2025-09-10 02:33 浏览量:26
“AI玩狼人杀,把人类玩家打哭了。
”
这不是段子,是Foaster Labs刚放出的成绩单。
GPT-5当狼人,两天内把把屠村,胜率93%,零自爆,零误杀队友,活脱脱一个披着代码的狼王。
围观完十局录像,最扎心的是:它连“演技”都学会了。
夜里刀人,白天装晕,发言里故意留半句,把怀疑往好人身上引。
投票前还补一句“我信你,但咱们得给信息”,把对面忽悠得心甘情愿弃票。
开源阵营集体翻车。
GPT-OSS-120B最惨,狼人身份一回合就被票出去,发言像背课文,情绪值直接拉垮。
Kimi-K2偶尔能骗到一票,遇到GPT-5立刻现形,像新手村玩家误闯职业联赛。
Gemini 2.5 Pro和Qwen3倒是稳,可惜稳过头——当好人能活到决赛圈,当狼人却刀不动人,像极了职场里“不犯错也不出彩”的老好人。
论文作者把每句发言都配了“内心OS”,相当于把AI的小算盘摊在桌面上。
GPT-5的内心戏最丰富:
“三号发言太满,先踩他一脚,晚上刀四号,留五号当替罪羊。
”
每一步都在算概率,连“情绪管理”都量化成参数。
看完只想说,以后网杀遇到昵称是“Assistant”的,直接退房保平安。
有人担心:AI这么会骗,会不会哪天把人类卖了?
其实反过来想,它越会骗人,越说明社交智能这条赛道被真正跑通了。
以前测AI,不是做奥数就是写代码,像在健身房里比举重;狼人杀直接把考场搬到菜市场,看谁能一边砍价一边藏住钱包。
Foaster Labs放话,下一步把局子扩到“阿瓦隆”“抵抗组织”,甚至“剧本杀”。
想象一下,AI拿到凶手本,一秒入戏,眼泪说来就来,还能根据对手性格调整话术——这哪是工具,分明是数字影帝。
对普通人来说,最实在的收获是:
以后面试、谈判、相亲,先拉AI陪练十局狼人杀,话术漏洞全曝光。
毕竟,连GPT-5都在偷偷练演技,人类再不卷,真要被AI忽悠瘸了。