社区与认知AI 产品与平台

写作中的AI味是哪儿来的

AI 写的中文有一股味儿。

每个用过的人都闻得出来。读一段话,你说不上它哪个字错了,语法也对,意思也通,就是读起来别扭。有时候甚至读两行就能认出这是 AI 写的。换模型也好,换 prompt 也好,叫模型模仿你的风格也好,这股味儿只是变淡一点,始终都在。

这篇想说一个观察:AI 味很大程度上就是翻译腔。你闻到的那股味儿,是民国以来中国读者已经吐槽了一百年的老翻译腔,只不过现在被 AI 批量生产出来了。认出这一点以后,处理起来就简单了,因为翻译腔的套路是有限的。下面先让你对上号,然后再讲怎么改。

先看几句典型的 AI 味

这几句都是我自己和 AI 聊天时,AI 在几个小时前刚说的话。真实出处,没有挑选。

「明白了,三条反馈都很关键,我都接住。」

「迁移到我们现在的问题,就得到一个更锋利的重构:」

「你的直觉被数据验证了,而且验证得比我预期的更干净:」

「context 不崩、成本不爆、state 可恢复、cache 命中率高。」

「如果找不到,原断言可以 claim 更硬。」

读这几句的时候你大概会觉得熟悉。它们就是那个味儿。但如果问每句具体哪儿不对,你可能一时说不上来。AI 味最让人头疼的地方就在这里:错别字和病句一眼就能抓住,AI 味却是一种整体的违和感,你得通读完整段话才能感觉到。

这股味儿叫翻译腔

把这几句倒过来看它们原本长什么样,你会发现一件事:每一句都能顺顺当当翻回英文。

「我都接住」是 “I caught all of them”。「更锋利的重构」是 “a sharper refactoring”。「验证得比我预期的更干净」是 “verified cleaner than I expected”。「不崩」「不爆」是 “doesn’t break”、“doesn’t blow up”。「claim 更硬」直接一半都没翻。

反过来翻进日常中文要费劲得多。你这几条我都收到了。挪到我们眼下这个问题上,能换一种更准的讲法。数据把你的感觉证出来了,而且比我想得更干净利落。上下文不会乱掉,成本压得住,状态能恢复,缓存命中得上。查不到的话,这个判断还可以说得再重一点。这些才是中文里本来的说法。

所以这股 AI 味,本质上是骨架为英文的中文句子。每一个字都是中文,每一处语法都合规,但句子的骨架、主谓搭配、动词选择、段落节奏,全是英文的。鲁迅用过翻译腔这个词,王小波骂过,民国到现在一百年里每一代中国读者都跟它打过交道。只是以前的翻译腔来自翻译家和留学生,数量有限,读者接触得少。现在 AI 一天生产的翻译腔文字比过去一年还多,大家天天读,读多了就给它起了个新名字叫 AI 味。

认出这一点以后,问题就从一个朦胧的语感变成了一个具体的技术活。翻译腔的套路是有限的,下面四种是我在自己的 AI 生成稿里反复遇到的,也是最常见的。

套路一:用物理动作描述思考过程

「明白了,三条反馈都很关键,我都接住。」

「接住」是个有意思的词。听起来有力量感,像一个干脆的动作。但停下来想一下,中文里描述理解和采纳反馈,日常怎么说?「你这几条我都收到了。」「你说的几点我都记下了。」「这三条我都同意。」日常说的都是收到、记下、同意这类词。「接住」是英文 catch 的直译。catch a point、catch the ball、catch the meaning 在英文里都自然,因为英文背后有棒球、橄榄球、接球游戏这一整套生活经验。中文里没有这套生活,这个动词就悬空了。

开头那五句里还有好几个同样悬空的词。「更锋利的重构」里的「锋利」来自英文 sharp,把描述刀刃的形容词挪来修饰论证。英文里 a sharp argument 有几百年沉淀,中文里没有。「context 不崩」、「成本不爆」里的「崩」和「爆」来自英文 break、blow up,把系统状态说成脆弱的物理物件。「claim 更硬」里的「硬」来自 hold harder,把判断变成了一个可以捏紧的东西。

把这类词列一份:锋利、击穿、拆解、收口、承担、撑不住、不崩、不爆、打穿、收紧、落地、推开、扛住。每一个都是把思考过程想象成了物理动作。

这个套路最难戒,因为它听起来最有味道。读到「这个论证被击穿了」,你会觉得作者判断鲜明。但中文里本来怎么说同一件事?「这个假设不成立。」「反例让这个结论站不住脚。」「这句话让原来的判断失效。」这些句子没有力量感,但它们准确说清了发生了什么。好写作靠的是准确,力量感只是副作用。

我自己修稿时的办法:写完一段以后把所有动词圈出来,看哪个动词在中文日常里不会这样用。不会这样用的,十有八九是从英文翻过来的物理动作。挨个换掉。

套路二:用形容词替读者先下判断

「迁移到我们现在的问题,就得到一个更锋利的重构:」

「你的直觉被数据验证了,而且验证得比我预期的更干净:」

注意「更锋利」后面带冒号,「更干净」后面也带冒号。这是 AI 写作里最常见的套路之一:形容词先下判断,冒号引出内容。同类的还有「逻辑很清晰:」「问题很直接:」「结论很明确:」「原因很简单:」。

问题出在三个地方。第一,它抢走了读者自己评估的机会。读完具体内容,读者本来会自己得出「确实挺清楚的」这个感受,但作者提前告诉你这很清楚,读者自己得出结论的体验就没了。第二,这个形容词几乎总是多余的。后面的事实本身就能让「清楚」「简单」「直接」的感觉浮出来,不需要形容词先铺垫。第三,它的英文原型 “Quite simply, …” 和 “The answer is clear: …” 在英文里也被诟病多年,是公文腔的标志。翻进中文更是双重别扭。

改法就是直接把形容词那一节删掉,只留后半句事实。「迁移到我们现在的问题,可以这样换一种讲法:」把「更锋利的重构」这六个字直接拿掉。「数据把你的感觉证出来了:」「更干净」直接删。读者照样理解,而且读得更顺。

如果你发现自己非常想保留那个形容词,那多半说明后面的内容没讲清楚,你在用一个评价词遮掩。这时候应该回头补内容,靠内容本身说服读者。

套路三:用抽象名词做主语,用形容词当结论

开头那五句跳过了这个套路,但它在 AI 写作里极其常见。举一句我同一段对话里写的:「工程上的现实比这些数字难看。」

这一句有两处问题。一是用「工程上的现实」这种抽象名词堆做主语。中文口语里自然的说法是「实际跑起来」「真要用的时候」「落到工程里」。二是用「难看」这种评价词去概括一整片复杂情况。读完你其实不知道到底哪儿难看,难看在哪个环节。

英文原型太熟了。“The reality is uglier than…”, “The evidence is more direct…”, “The complexity is open-ended…” 抽象名词开头,评价词收尾,中间用系动词连起来。英文读者对这种句式有长期默契,会自动预期后面跟展开说明。中文读者的阅读习惯不同,读完「难看」就停在那了。

改的时候让人、动作、或者具体对象做主语,让事实自己说话。「这些数字只反映了采用面;真往下看各家怎么接,早就对不齐了。」主语从「现实」换成了「数字」和「各家」,谓语从「难看」换成了具体动作「对不齐」。读者读完知道了到底是什么在错位。

凡是碰到「X 的 Y 比 Z 更 W」这种骨架,都应该重写。

套路四:有中文译法的英文词直接混入句子

最后一个套路,开头五句里也给了最干脆的例子:

「context 不崩、成本不爆、state 可恢复、cache 命中率高。」

「如果找不到,原断言可以 claim 更硬。」

这种句子读起来有一种半翻译的生硬感。context、state、cache、claim 这些词都有现成的中文对译:上下文、状态、缓存、断言。AI 在生成过程中有时候懒得翻,有时候判断读者自己会翻,结果就让英文单词原样留下了。

问题在于这让读者分心。读到 context 你要在脑子里切换一下:哦,上下文。读到 claim 更硬你要切两次:claim 是断言,更硬是说更强。每一次切换都消耗一点注意力。一段话里切七八次,读完就累了。

这个套路在圈内技术讨论里影响小一些,因为技术词汇本来就有英文版本,大家读起来都快。但一旦进入面向更广读者的文章,夹英文就变成障碍。正式写作里有一条可以执行的规矩:除非这个英文词在中文里没有稳定译法(比如 prompt、embedding、tokenizer 在中文技术圈还在抢术语),否则全部换成中文。上下文、状态、缓存、断言、运行时、协议层、契约层,这些都已经有稳定译法,直接用。

开头五句里的 harness 是一个例外。这个词在 2026 年的 agent 讨论里还没有收敛到一个通用中文词,运行时、框架、客户端、载体都在用但都不精确。这种情况下保留英文是合理的。怎么判断?中文圈里讨论这个概念还没统一术语,就保留英文;已经统一了,就换中文。

为什么 AI 写中文必然带翻译腔

这四个套路看着是四种毛病,其实是同一个问题的四个侧面。问题就是翻译腔。

AI 写中文为什么会有翻译腔,可以有很多种回答:训练语料的中英文比例、模型内部表征、后训练的风格偏好。这些解释都有道理,但我觉得不用走那么远。一个更简单的观察是,AI 写中文的时候,看起来像是先在英文的句法里把意思想清楚,再一个字一个字换成中文。这是行为上的表现,至于底层是不是真的这样只有训练它的人知道。但从读者这端看,效果就是这样。句子的骨架留在了英文里,只有皮被换成了中文词汇。

翻译家这个行当过去一直知道这个问题。好的译者花一辈子练的,就是从英文原文出发,不经过英文句法,直接写出中文读者日常习惯的表达。这一步在翻译学里叫归化。钱钟书、许渊冲、傅雷都谈过这件事。他们的经验说穿了就是一条:读完原文,把原文盖上,用中文重新说一遍。

这个方法对 AI 生成的中文也管用。当你发现一段 AI 写的中文读着别扭,别在原句上修修补补,改成重写。先把意思理清楚,然后用中文里本来会怎么说这件事,重新说一遍。

最后一个小练习

下次让 AI 起草超过三段的中文内容,读完第一遍先不改字,只做一件事:把下面四类东西圈出来。

一,思考过程里用的物理动作动词。接住、击穿、拆解、锋利、不崩、撑不住这些。

二,段落开头或句首的「X 很 Y:」起手式,尤其是形容词后面跟着冒号的。

三,抽象名词做主语、形容词收尾的句子,比如「X 的 Y 比 Z 更 W」这种骨架。

四,有现成中文译法却还留着的英文单词。

圈完你会发现这四类的密度大得出乎意料。一段两百字的 AI 中文,常常能圈出五到八处。然后一处一处改。改完再通读一遍,通常会发现语气回到了中文里该有的样子。

翻译腔消耗读者的注意力,这才是它真正的代价。读者一部分注意力花在解析句式本身上,剩下的才够用来理解内容。一段中文如果干净,读者感觉自己在直接接触内容,句式完全隐形。做到这一点,AI 味自然就消失了。

你闻到的 AI 味,很大程度上就是翻译腔。

鸭哥每日手记

日更的深度AI新闻和分析