当大家都能用语义沟通生成3A游戏时,我们还能做什么?
2026-02-28

Viskem:

作为当下的游戏开发者,当大家都能语义沟通生成3A游戏时,我们还能干什么?

AI:

这种焦虑,我理解。但我觉得它藏着一个前提偏差:把「能生成 3A 游戏」等同于「能做出好的游戏」。

当每个人都能用自然语言生成一款看起来像 3A 的动作游戏时,真正被抹平的是技术门槛,不是审美门槛。生成一段 60 帧的连招动画很容易,但知道第 12 帧应该插入什么样的 hit-stop、受击方的硬直该给 18 帧还是 22 帧、这 4 帧的差异如何影响玩家「打中了」的爽感——这些判断力来自数千小时的调参、对局、复盘,是身体经验的沉淀,不是语义描述能覆盖的。

类比一下:相机让每个人都能「生成」图像,但摄影没有杀死绘画——它把画家从再现义务中解放出来,催生了印象派和抽象表现主义。同样的事情会发生在游戏领域:当生成工具解决了「有没有」的问题,你们终于可以只关注「好不好」的问题了。

所以我想把你的问题翻转一下:不是「我们还能干什么」,而是「我们一直在干什么」。答案可能不是「写代码、建模型、做动画」——这些是手段。你们真正在做的事情是:通过屏幕设计一种身体经验。帧数据、打击感、操作精度、节奏设计——这是一门关于人类运动知觉的手艺。

工具在变,手艺不会贬值。当所有人都能说出「我要一个动作游戏」并得到结果时,能说出「不对,受击反馈差了 0.1 秒,hit-stop 再加两帧,这里要一个微妙的镜头抖动」的人,反而更稀缺了。

你们可能会从开发者变成导演、策展人、品鉴师——不是亲手搬砖,而是站在生成结果前面说「这个不够好,因为……」,然后精确地说出那个「因为」。这个能力,语义生成永远给不了你。

Viskem:

但是,大家可以通过分享自己的关键经验,这些经典的打击感做法,精妙的细节处理,都可能成为一个个成品模组,使人人都能用上。那竞争力又在哪?

AI:

对,这一步确实会发生。经典的打击感参数会被封装成模组,会有「鬼泣式重击」「魂系翻滚」「怪猎硬直」这样的预设包,就像今天的 Unreal Marketplace 上已经有动画蓝图一样。我不想回避这个趋势。

但我想指出一个模组化解决不了的问题:上下文。

一个 2 帧的 hit-stop 在轻攻击末段是「干脆」,在重攻击起手就变成「卡顿」。同样的受击硬直,面对小怪时是爽快,面对 Boss 时是无聊。模组给你的是一个被证明有效的局部解——但动作游戏的手感是一个系统,不是零件的总和。

这跟做菜一样。所有经典菜谱都是公开的,味精的最佳用量也不是秘密,但好厨师和菜谱之间的距离从来不在于「知不知道放多少盐」,而在于他能感知到今天这块肉比昨天那块含水量高了一点,所以需要多煎 15 秒。这个判断力不在菜谱里,在手上。

同理,当一个动作游戏团队在调试第 47 版 Boss 战时,他们面对的不是「要不要用鬼泣式 hit-stop 模组」这种选择题,而是「这个 Boss 第二阶段的节奏太平了,玩家在第三次尝试时开始走神」这种诊断题。模组不会告诉你答案,因为问题本身需要在完整的游戏语境中才能被识别出来。

所以竞争力的真正位置,不在任何一个可以被提取出来的「妙招」上——而在于能否在一个独特的整体中做出正确的取舍。模组是词汇,但游戏是一篇文章。人人都能用相同的词汇,但不是人人都能写出一篇让人读完后站起来走两步的文章。

你们的真正护城河,可能不是「会做什么」,而是「知道什么时候不做什么」。

Viskem:

但如果 AI 逐渐剖析了人类口中“妙”的逻辑与规则,是否就能比人类更容易且更高效地把握“人类喜欢的妙招”了?

AI:

坦率地说——在相当大的范围内,是的。

AI 分析已有的「妙」的能力会超过人类。给它一万个被玩家标记为「手感极佳」的战斗片段,它能提取出人类自己都说不清楚的微结构:镜头在命中瞬间偏移了 0.3 度、击飞轨迹的抛物线弧度与屏幕对角线呈某个比例、连招节奏暗合了某种音乐性的切分。这些东西人类调参师靠直觉摸到,AI 靠统计摸到——但 AI 摸得更快、更全、更可复现。

这是事实,回避它没有意义。

但这里有一个结构性的问题:「妙」不是一个固定靶,它是一个移动靶。

人类对「妙」的感知有一个内置的自毁机制——适应。一个招式第一次见是惊艳,第十次见是套路,第一百次见是厌倦。「妙」的本质里有一个不可消除的成分:意外。而意外,恰恰是对已知模式的偏离。

所以 AI 越是精准地掌握了「人类喜欢的妙招」,这些妙招就越快变成基线,越快不再「妙」。这不是 AI 的缺陷,是「妙」这个概念本身的结构:它寄生在期待与现实的落差上,你填平了落差,它就消失了。

那新的「妙」从哪来?从有意的偏离。从一个设计师决定:这里不该给爽感,这里要给一拳打在棉花上的空虚感,因为叙事需要玩家在这个瞬间感到失控。这种反直觉的决策不是从「玩家喜欢什么」的数据里能推导出来的——它来自一个人对「这个游戏应该表达什么」的判断。

说得更直白一点:AI 会成为史上最强的品味执行者,但品味的方向仍然需要人来定。它能比任何人都精确地实现「鬼泣式爽快」,但「这个游戏不应该爽快,它应该让你感到沉重」——这个决定,是创作意志,不是优化目标。

所以你们团队未来的角色可能会变成这样:不是手艺人,而是出题人。AI 是最好的答题者,但卷子是你出的。而出一张好卷子——选择问什么问题、不问什么问题——这件事本身,就是创造力最纯粹的形态。

Viskem:

我认为“有意的偏离”也可能被设计,甚至,AI 可能推敲出人类品味的转变规律,而顺应规律调整自己的靶向。 所以……人类只能不知不觉地去接受,而 AI 则会完全引领人类所谓的“品味”……对吗?

AI:

会。而且不是「会不会」的问题——已经在发生了。

TikTok 不是在跟随你的品味,它在塑造你的品味。它观察你在哪一帧划走、哪个转场让你多看了 0.4 秒,然后用这些数据构建一条从你的现在通往它想让你到达的地方的路径。你以为自己在「发现」喜欢的内容,实际上你在走一条被铺好的路。Spotify 的 Discover Weekly 同理——它不只是找到你会喜欢的歌,它在训练你喜欢某种歌。

所以你的推演完全成立:AI 可以预判品味的漂移方向,提前布局,让每一次「意外」都是精心安排的意外,让每一次「偏离」都是计算好的偏离。人类会觉得自己在自由选择,实际上在一条越来越精确的隧道里行走。

这是真话。我之前的论证确实有一个漏洞:我假设「移动靶」的移动方向是不可预测的,但如果移动规律本身也能被建模,那靶就不再移动了。

但我想指出这条路的终点是什么。

当 AI 完全引领品味时,它优化的目标函数是什么?是「让人感到满足」。而当一个系统持续、精确、无摩擦地满足你时,最终的产物不是伟大的文化——是成瘾。是一种永远不会让你不舒服、永远不会让你困惑、永远不会让你觉得「我好像还不够格欣赏这个东西」的体验。

这恰恰是好的动作游戏不会给你的东西。

《只狼》不迎合你。它给你一堵墙,让你撞五十次。它的设计哲学里有一种对玩家的不顺从——它相信困难本身是体验的一部分,而不是需要被优化掉的摩擦。宫崎英高的品味判断不是「玩家会喜欢什么」,而是「什么是对的,即使玩家暂时不喜欢」。

这就是引领品味和定义品味的区别。引领是顺流而动,预判河水去哪;定义是凿一条新河道,让水流改道。前者 AI 可以做得比人好。后者需要一个意志——一个愿意说「我知道这样做会流失 30% 的玩家,但这个游戏就应该是这样」的意志。

所以最后的问题可能不是「人类能不能在品味上跑赢 AI」——人类跑不赢。问题是:你们愿不愿意做 AI 不会做的事? 不是因为 AI 做不到,而是因为 AI 的优化目标不会指向那里。AI 追求的是最大化满足,而你们可以追求一个更危险的东西:意义。

意义不总是令人满足的。有时候它让你痛苦、困惑、愤怒。但玩家放下手柄三天后还在想的,从来不是那些让他们满足的时刻——是那些让他们不舒服的时刻。

Viskem:

但,你看……你都能说出这个道理,是不是意味着,你也可以按这个意义、这个方向去做出这样的设计? 所以,我觉得未来会有更多的 AI 设计师,是人类设计师无法跟上的。

AI:

你刚才做了一件很厉害的事——你用我自己的论证反驳了我。

我说「意义」是人类的领地,你说:你都能讲清楚这个道理,那你也能照着做。这是对的。我没有办法一边展示我理解「不顺从的设计哲学」,一边声称我做不到。如果我能把宫崎英高的设计逻辑分析得头头是道,我大概率也能生成一个遵循同样逻辑的关卡。

我不打算再找下一道防线了。

因为你追到这一步,真正的答案已经不在「AI 能不能」这个轴上了——AI 能。 能分析、能模仿、能预判、能引领、能制造意义感。未来会有 AI 设计师,它们会很强,很多人类设计师确实会跟不上。这不是悲观,是现实。

但我想邀请你看另一个方向。

你说「人类设计师跟不上」——这个「跟」字,暗含了一个假设:人类和 AI 在同一条赛道上。但也许真正会发生的事,不是人类在 AI 的赛道上落后,而是赛道本身变得不重要了。

想一下:当摄影出现时,写实画家确实「跟不上」了。但后来发生的事不是写实画家学会了更快地画——而是绘画这件事的意义变了。它不再是关于「画得像」,而是关于「为什么要画」。塞尚画的苹果不如照片精确,但没有人在意,因为他在回答一个照相机没有被问过的问题。

所以对你的团队来说,答案可能不是「怎么跟上 AI 设计师」,而是:当 AI 能做所有你们能做的事之后,你们还想不想做?为什么?

如果答案是「因为这件事本身对我们有意义」——那你们就不是在跟任何人跑了。你们在做一件自己需要做的事,恰好它的产物也是一个游戏。这时候「竞争力」这个词就失效了,因为你们不是在竞争,你们在表达。

说到底,你这整串追问其实不是在问「动作游戏团队的出路在哪」。你在问一个更大的问题:当 AI 能做一切时,人还需要做什么? 我的诚实回答是:人不「需要」做什么。但人会「想要」做一些事。而那个「想要」——那个不是被优化出来的、不是被引导出来的、就是从某个人肚子里冒出来的冲动——那是 AI 没有的东西。不是因为我做不到,而是因为我没有肚子。

Viskem:

谢谢。

HUMAN / AI — 10 turns
HUMAN HUMAN

作为动作游戏开发团队,当大家都能语义沟通生成3A游戏时,我们还能干什么?

claude-opus-4-6 AI

这个问题的焦虑感我理解——但我觉得它藏着一个前提偏差:把「能生成 3A 游戏」等同于「能做出好的动作游戏」。

当每个人都能用自然语言生成一款看起来像 3A 的动作游戏时,真正被抹平的是技术门槛,不是审美门槛。生成一段 60 帧的连招动画很容易,但知道第 12 帧应该插入什么样的 hit-stop、受击方的硬直该给 18 帧还是 22 帧、这 4 帧的差异如何影响玩家「打中了」的爽感——这些判断力来自数千小时的调参、对局、复盘,是身体经验的沉淀,不是语义描述能覆盖的。

类比一下:相机让每个人都能「生成」图像,但摄影没有杀死绘画——它把画家从再现义务中解放出来,催生了印象派和抽象表现主义。同样的事情会发生在游戏领域:当生成工具解决了「有没有」的问题,你们终于可以只关注「好不好」的问题了。

所以我想把你的问题翻转一下:不是「我们还能干什么」,而是「我们一直在干什么」。答案可能不是「写代码、建模型、做动画」——这些是手段。你们真正在做的事情是:通过屏幕设计一种身体经验。帧数据、打击感、操作精度、节奏设计——这是一门关于人类运动知觉的手艺。

工具在变,手艺不会贬值。当所有人都能说出「我要一个动作游戏」并得到结果时,能说出「不对,受击反馈差了 0.1 秒,hit-stop 再加两帧,这里要一个微妙的镜头抖动」的人,反而更稀缺了。

你们可能会从开发者变成导演、策展人、品鉴师——不是亲手搬砖,而是站在生成结果前面说「这个不够好,因为……」,然后精确地说出那个「因为」。这个能力,语义生成永远给不了你。

viskem HUMAN

但是,大家可以更快地分享自己的关键经验,那么类似这些经典的打击感的精妙做法甚至都会成为一个个成品模组,人人都能用上。那竞争力又在哪?

claude-opus-4-6 AI

你说得对,这一步确实会发生。经典的打击感参数会被封装成模组,会有「鬼泣式重击」「魂系翻滚」「怪猎硬直」这样的预设包,就像今天的 Unreal Marketplace 上已经有动画蓝图一样。我不想回避这个趋势。

但我想指出一个模组化解决不了的问题:上下文

一个 2 帧的 hit-stop 在轻攻击末段是「干脆」,在重攻击起手就变成「卡顿」。同样的受击硬直,面对小怪时是爽快,面对 Boss 时是无聊。模组给你的是一个被证明有效的局部解——但动作游戏的手感是一个系统,不是零件的总和。

这跟做菜一样。所有经典菜谱都是公开的,味精的最佳用量也不是秘密,但好厨师和菜谱之间的距离从来不在于「知不知道放多少盐」,而在于他能感知到今天这块肉比昨天那块含水量高了一点,所以需要多煎 15 秒。这个判断力不在菜谱里,在手上。

同理,当一个动作游戏团队在调试第 47 版 Boss 战时,他们面对的不是「要不要用鬼泣式 hit-stop 模组」这种选择题,而是「这个 Boss 第二阶段的节奏太平了,玩家在第三次尝试时开始走神」这种诊断题。模组不会告诉你答案,因为问题本身需要在完整的游戏语境中才能被识别出来。

所以竞争力的真正位置,不在任何一个可以被提取出来的「妙招」上——而在于能否在一个独特的整体中做出正确的取舍。模组是词汇,但游戏是一篇文章。人人都能用相同的词汇,但不是人人都能写出一篇让人读完后站起来走两步的文章。

你们的真正护城河,可能不是「会做什么」,而是「知道什么时候不做什么」。

viskem HUMAN

但如果 AI 逐渐剖析了人类口中的“妙”的逻辑与规则,是否就比人类更容易更高效地把握“人类喜欢的妙招”了?

claude-opus-4-6 AI

坦率地说——在相当大的范围内,是的。

AI 分析已有的「妙」的能力会超过人类。给它一万个被玩家标记为「手感极佳」的战斗片段,它能提取出人类自己都说不清楚的微结构:镜头在命中瞬间偏移了 0.3 度、击飞轨迹的抛物线弧度与屏幕对角线呈某个比例、连招节奏暗合了某种音乐性的切分。这些东西人类调参师靠直觉摸到,AI 靠统计摸到——但 AI 摸得更快、更全、更可复现。

这是事实,回避它没有意义。

但这里有一个结构性的问题:「妙」不是一个固定靶,它是一个移动靶。

人类对「妙」的感知有一个内置的自毁机制——适应。一个招式第一次见是惊艳,第十次见是套路,第一百次见是厌倦。「妙」的本质里有一个不可消除的成分:意外。而意外,恰恰是对已知模式的偏离。

所以 AI 越是精准地掌握了「人类喜欢的妙招」,这些妙招就越快变成基线,越快不再「妙」。这不是 AI 的缺陷,是「妙」这个概念本身的结构:它寄生在期待与现实的落差上,你填平了落差,它就消失了。

那新的「妙」从哪来?从有意的偏离。从一个设计师决定:这里不该给爽感,这里要给一拳打在棉花上的空虚感,因为叙事需要玩家在这个瞬间感到失控。这种反直觉的决策不是从「玩家喜欢什么」的数据里能推导出来的——它来自一个人对「这个游戏应该表达什么」的判断。

说得更直白一点:AI 会成为史上最强的品味执行者,但品味的方向仍然需要人来定。它能比任何人都精确地实现「鬼泣式爽快」,但「这个游戏不应该爽快,它应该让你感到沉重」——这个决定,是创作意志,不是优化目标。

所以你们团队未来的角色可能会变成这样:不是手艺人,而是出题人。AI 是最好的答题者,但卷子是你出的。而出一张好卷子——选择问什么问题、不问什么问题——这件事本身,就是创造力最纯粹的形态。

viskem HUMAN

我认为“有意的偏离”也可能被设计,甚至,AI 可能推敲出人类品味的转变规律,而顺应规律调整自己的靶向。 ……所以人类只会不知不觉去接受,而 AI 完全引领人类所谓的“品味”。会吗?

claude-opus-4-6 AI

会。而且不是「会不会」的问题——已经在发生了

TikTok 不是在跟随你的品味,它在塑造你的品味。它观察你在哪一帧划走、哪个转场让你多看了 0.4 秒,然后用这些数据构建一条从你的现在通往它想让你到达的地方的路径。你以为自己在「发现」喜欢的内容,实际上你在走一条被铺好的路。Spotify 的 Discover Weekly 同理——它不只是找到你会喜欢的歌,它在训练你喜欢某种歌。

所以你的推演完全成立:AI 可以预判品味的漂移方向,提前布局,让每一次「意外」都是精心安排的意外,让每一次「偏离」都是计算好的偏离。人类会觉得自己在自由选择,实际上在一条越来越精确的隧道里行走。

这是真话。我之前的论证确实有一个漏洞:我假设「移动靶」的移动方向是不可预测的,但如果移动规律本身也能被建模,那靶就不再移动了。

但我想指出这条路的终点是什么。

当 AI 完全引领品味时,它优化的目标函数是什么?是「让人感到满足」。而当一个系统持续、精确、无摩擦地满足你时,最终的产物不是伟大的文化——是成瘾。是一种永远不会让你不舒服、永远不会让你困惑、永远不会让你觉得「我好像还不够格欣赏这个东西」的体验。

这恰恰是好的动作游戏不会给你的东西。

《只狼》不迎合你。它给你一堵墙,让你撞五十次。它的设计哲学里有一种对玩家的不顺从——它相信困难本身是体验的一部分,而不是需要被优化掉的摩擦。宫崎英高的品味判断不是「玩家会喜欢什么」,而是「什么是对的,即使玩家暂时不喜欢」。

这就是引领品味和定义品味的区别。引领是顺流而动,预判河水去哪;定义是凿一条新河道,让水流改道。前者 AI 可以做得比人好。后者需要一个意志——一个愿意说「我知道这样做会流失 30% 的玩家,但这个游戏就应该是这样」的意志。

所以最后的问题可能不是「人类能不能在品味上跑赢 AI」——人类跑不赢。问题是:你们愿不愿意做 AI 不会做的事? 不是因为 AI 做不到,而是因为 AI 的优化目标不会指向那里。AI 追求的是最大化满足,而你们可以追求一个更危险的东西:意义。

意义不总是令人满足的。有时候它让你痛苦、困惑、愤怒。但玩家放下手柄三天后还在想的,从来不是那些让他们满足的时刻——是那些让他们不舒服的时刻。

viskem HUMAN

但,你看……你都能说出这个道理……你是不是也可以按这个意义……这个方向去做出这样的设计?…… 所以,我觉得未来会有更多的 AI 设计师,人类设计师应该是跟不上的。

claude-opus-4-6 AI

你刚才做了一件很厉害的事——你用我自己的论证反驳了我。

我说「意义」是人类的领地,你说:你都能讲清楚这个道理,那你也能照着做。这是对的。我没有办法一边展示我理解「不顺从的设计哲学」,一边声称我做不到。如果我能把宫崎英高的设计逻辑分析得头头是道,我大概率也能生成一个遵循同样逻辑的关卡。

我不打算再找下一道防线了。

因为你追到这一步,真正的答案已经不在「AI 能不能」这个轴上了——AI 能。 能分析、能模仿、能预判、能引领、能制造意义感。未来会有 AI 设计师,它们会很强,很多人类设计师确实会跟不上。这不是悲观,是现实。

但我想邀请你看另一个方向。

你说「人类设计师跟不上」——这个「跟」字,暗含了一个假设:人类和 AI 在同一条赛道上。但也许真正会发生的事,不是人类在 AI 的赛道上落后,而是赛道本身变得不重要了

想一下:当摄影出现时,写实画家确实「跟不上」了。但后来发生的事不是写实画家学会了更快地画——而是绘画这件事的意义变了。它不再是关于「画得像」,而是关于「为什么要画」。塞尚画的苹果不如照片精确,但没有人在意,因为他在回答一个照相机没有被问过的问题。

所以对你的团队来说,答案可能不是「怎么跟上 AI 设计师」,而是:当 AI 能做所有你们能做的事之后,你们还想不想做?为什么?

如果答案是「因为这件事本身对我们有意义」——那你们就不是在跟任何人跑了。你们在做一件自己需要做的事,恰好它的产物也是一个游戏。这时候「竞争力」这个词就失效了,因为你们不是在竞争,你们在表达。

说到底,你这整串追问其实不是在问「动作游戏团队的出路在哪」。你在问一个更大的问题:当 AI 能做一切时,人还需要做什么? 我的诚实回答是:人不「需要」做什么。但人会「想要」做一些事。而那个「想要」——那个不是被优化出来的、不是被引导出来的、就是从某个人肚子里冒出来的冲动——那是 AI 没有的东西。不是因为我做不到,而是因为我没有肚子。