今年 2 月底到 5 月底,yage.ai 的周活用户从 2,500 涨到了约 7,000,Newsletter 订阅从 300 涨到 1,200,Twitter 关注从 170 涨到 4,800。这三个数字放一起看,容易给人一个印象:博主运营很勤快。实际是另一回事。这三个月里我没有手动发过一条 Twitter,没有手动写过一期 Newsletter,也没有做过一次 SEO 优化。这些东西全是 AI 在跑。
我做的事情很少:付了几笔钱,帮它逆向了一个 API,每天花两分钟圈选题,每隔几周看一眼方向。剩下的全是 AI 在跑。
这是一次复盘,把 AI 替我做了什么、怎么做的、我做了什么、什么有效什么没效,如实写出来。
用 GA4 的周级 active users 看全貌最清楚。
以周活跃用户看,3 月初基线约 2,500,5 月底稳定在约 7,000,增长近 3 倍。这个增长过程并不平滑:每篇新文章发布后都会有一次脉冲,偶尔碰上传播面比较广的内容,一周能冲到更高。但这些波动来去都快,真正说明问题的是脉冲消退之后的平台。它没有跌回原点,而是一次次被垫高。
换成日均基线看也一样。3 月初日均约 255 users,5 月底日均约 1,000 users,增长约 4 倍。这个平台不是靠某一篇文章拉起来的,而是由几层承接系统一起形成:Twitter 账号从零到有、Newsletter 从 420 到 1,183 订阅者、Google 搜索每月带来 2,300 次点击、/share/ 页面成为站内主承接面。持续的内容输出带来持续的传播机会,这几层系统把一次次流量脉冲里留下来的注意力,变成了可重复触达的资产。
渠道结构也变了。3 月初 77% 的流量来自 Direct(无法归因的暗社交分享),Organic Search 只有 15%,社交几乎为零。到 5 月底,Organic Social 占 30-50%(根据发布量波动),Direct 降到约 35%,Organic Search 稳定在 15-20%,Email 和 Referral 各占 2-3%。3 月时网站本质上依赖他人手动分享链接,5 月时已经有一个多入口的承接系统。
搜索侧的数据更能说明结构变化。3 月初没有 GSC 数据(刚接入),到 5 月底,yage.ai 每月有 369,000 次展示和 2,300 次点击,平均排名 7.6。展示最大的两个页面是 ollama-cloud-vs-api-vs-subscriptions-en(74,194 次展示)和 mlx-apple-silicon-en(58,108 次展示),两个都是英文技术比较型内容。这些页面不是我刻意布局的 SEO 关键词,而是 AI 在运行调研和写作流程时自然产出的副产品。它们被 Google 收录和排名,不需要我为每一页做单独的 SEO 操作。
Twitter 这条线更明显。2 月底 Twitter 关注者 171,到 5 月底是 4,813。账号的发布节奏经历了三个阶段:3 月是冷启动,每两天一篇 thread,月发 15 条;4 月进入高频期,月发 180 条(日均 6 条),这个阶段也是账号增长最快的时期;5 月开始常态化,月发 74 条(日均 2-3 条),获得 458,000 次曝光和 22,190 次互动,互动率 5.05%。这个互动率在技术账号里算偏高,但对于一个没有任何人工互动的账号来说,它说明的是内容匹配度而非运营勤奋。
下面按系统拆,每套系统对应一个 AI 在执行的具体任务。
这是最早跑通的一套系统。AI 每天自动做几件事:从多个来源(arXiv、Twitter、Hacker News、微信公众号等)抓取当日 AI 领域的重要动态,选出 3-5 条最有信息差的,写成一段 200-400 字的中文摘要加简短判断,然后通过 Kit API 定时发送到全部订阅者。
AI 会写摘要,但更关键的是它做到了三件事:第一,每天自动运行,不需要人触发;第二,它带着特定的判断视角去总结:关注工程实践而非论文发布、关注具体机制而非宏大叙事;第三,它知道自己上一期写了什么,避免重复选题。
我做的事情是把判断视角告诉了它,它自己封装了 Kit API 调用、配好了 cron job。跑起来之后我就没再管过,每个月看一眼打开率和退订数。5 月日均打开率在 40-55%,点击率 3-6%,退订率低于 0.1%。这些数字在 Newsletter 行业属于中上水平,但更关键的是它是自动驾驶的。
有一次 AI 自己发现的优化。Kit 的订阅表单默认一进入页面就弹出来,AI 在分析 GA4 数据时发现 bounce rate 偏高,建议把表单触发时机改成用户滚动了 50% 页面内容后再出现。这个改动让订阅转化率提升了大约 40%。这不是我想到的,是 AI 看了数据之后提的。表单延迟触发算是行业里提高转化率的常见做法,但 AI 不需要我知道这个常识,它自己从数据里看出了问题并给出了方案。
这套系统有三个环节:内容生成、发布调度、效果复盘。
内容生成环节,AI 读完 yage.ai 的一篇文章,自动提取核心论点,改写成 5-6 条 Twitter thread。每条 thread 的第一条是 hook(反直觉观点或尖锐提问),中间 3-4 条展开独立论点,最后一条是原文链接。全部用中文写,风格要求是理性直接、不用 hashtag、不用标题党词汇。3 月初一次性生成了 30 篇存量文章的 thread,后续每发一篇新文章自动生成对应 thread。
发布调度环节,AI 通过 Typefully API 一次性把 30 个 thread 排进了日程表,每两天发一个,发布时间固定在 UTC 20:00(北京时间凌晨 4 点,美西中午 12 点,这个时间是 GA4 数据显示的双峰重叠窗口)。每篇新文章发完后,AI 自动生成 thread 并追加到调度队列里。
效果复盘环节是最晚跑通的。最初只有 Typefully 的账号级数据(总曝光、总互动),看不到单条帖子的表现。4 月底接入了 X 的单帖 analytics API 之后,AI 终于能按帖子级别对比数据。这时它提出了一个概念框架:把帖子分成三类,R(Reach,负责扩圈,看 impressions 和 follow 增长)、T(Traffic,负责导流,看 URL click 和 GA4 campaign session)、N(Newsletter,负责沉淀,看订阅转化)。这个分类让复盘从”这个帖子表现怎么样”变成了”这个帖子完成了它该完成的任务吗”。
我做的事情只有两件。第一,在 AI 建议下付了钱:Typefully Creator 计划 $12.50/月,Twitter Premium 用于解锁完整 analytics 权限。第二,帮它解决了一个技术障碍。X 没有公开的 per-post analytics API,AI 需要单帖数据才能做内容层面的复盘。我帮它逆向出了 X 的后台接口,把浏览器的 cookie 和 session token 喂给它,它在那个基础上自己封装了一套调用逻辑。除此之外,所有东西都是 AI 做的:读文章写 thread、设计格式规范、设定 UTM 标记规则、管理发布日历、分析单帖数据、提出 R/T/N 分类框架、给每周报告写 Twitter 部分。
3 月初最大的数据盲点是 77% 的 Direct 流量无法解释。GA4 把微信、Telegram、Slack 里分享的链接全部标为 Direct,因为这些分享不带 UTM 参数。我当时不知道流量具体从哪来,AI 也没法判断该在哪里投入精力。
搭建归因系统分了几个阶段。第一阶段是在所有外发内容上加 UTM
标记。Twitter thread 的链接全部带
utm_source=twitter&utm_medium=thread&utm_campaign=<slug>,Newsletter
的链接带 utm_source=kit&utm_medium=email。这一步把
Twitter 流量从 Direct 里剥离了出来,几个月下来已验证:UTM 化的 Twitter
流量(twitter / thread)从 0 涨到了当前的 10,000+
sessions/月。
第二阶段是微信归因。微信分享的流量在 GA4 里表现为 weixin110.qq.com 的 referral,但 bounce rate 高达 70%+,因为微信内置浏览器打开外链的体验很差。AI 注意到这个来源虽然 bounce 高,但 session duration 在持续改善,从最初的 30 秒升到了 80-100 秒,说明留下来读的人变多了。这个判断让我决定继续在微信里发链接而不开设公众号,省下了内容审核和双平台维护的成本。
AI 也接管了每周的增长分析。每周日或周一,它自动跑一遍 GA4、GSC、Kit、Typefully 的数据,生成一份 Markdown 报告,内容包括总体判断、渠道趋势、内容表现、搜索变化、Twitter 复盘和下一步建议。
3 月 3 日的第一份报告只有 GA4 数据,长度 400+ 行,核心发现是日均 300 users、77% Direct、搜索占比极低、社交渠道为零。到 5 月 25 日的报告已经包含五个数据源、GSC 单页级分析、Twitter 单帖 R/T/N 复盘、AI referral 追踪、Newsletter activation 诊断。报告本身从单纯的”最近流量多少”变成了一个决策系统。
AI 在写这些报告的过程中形成了自己的判断语言。它不会说”流量下降了 50%,需要改善”,而是说”5 月是峰值后的可控回落,社交退潮和底盘稳定同时发生”。这个差别不是修辞问题,是认知深度的问题。前者只报告了一个数字变化,后者给了一个判断框架。这个框架让下一期的 AI 可以站在上一期的判断上继续推进,而不是每次从头复述数据。
SEO 同样是 AI 在全权负责,我只是最后点头的那个人。
3 月初 AI 发现 robots.txt 没有显式允许 AI 爬虫抓取,于是添加了 GPTBot、ClaudeBot、PerplexityBot 的 Allow 规则。这一步的直接效果很小,但半年后回头看,所有被 AI 引用的页面都是从这个改动开始的。
4 月 AI 发现一个新现象:claude.ai 和 chatgpt.com 开始带来 referral 流量,虽然总量只有每月 100-200 sessions,但 session duration 高达 200-500 秒,bounce rate 低于 50%。这比大部分搜索流量质量都高。AI 判断这些 AI 引用流量会持续增长,于是自己动手优化了页面结构,确保每个小节都有独立的结论段,让 AI 在回答用户问题时更容易抓取和引用。这个改动被它同步到了后续所有英文版文章里。
5 月 AI 识别出了两个 SEO 问题页面。ollama-cloud-vs-api-vs-subscriptions-en 每月有 74,000 次展示、排名 6.5,但 CTR 只有 0.24%。mlx-apple-silicon-en 有 58,000 次展示、排名 7.1,CTR 0.09%。AI 的判断是:这两个页面已经被 Google 认为值得展示给大量用户,但标题和摘要没有充分接住搜索意图。它自己动手改了两个页面的 title、meta description 和首段摘要,按它的估算,把 CTR 从 0.2% 提升到 1%,每月就能多拿约 1,300 次点击。这个优先级比写新文章高得多。
三个月的实验里,有些东西被验证了,有些被证伪了。
有效的部分。
第一,自动分发比内容量大更重要。3 月时 yage.ai 已经有 370+ 篇文章,但周活只有 2,500。4 月开始 Twitter 自动分发后,同样的内容池子,周活跃用户稳定到了 7,000 左右。不是内容不够多,是没有人帮内容找到读者。AI 解决了分发问题。
第二,AI 在数据分析和模式识别上做的事,比在内容创作上做的事更有杠杆。写一篇 Newsletter 摘要,AI 做和人工做的差异不大。但从几百行 GA4 数据里找到”Direct 流量已经退到稳定基线,WeChat share 在逆势增长”这种判断,人工做需要每个领域都分半小时去盯,AI 做只需要跑一遍脚本加上 prompt 里的分析框架。时间和精度上都不在一个量级。
第三,反馈闭环比单次优化重要。表单延迟触发这个改动本身不神奇,神奇的是 AI 能自己发现 bounce rate 异常、提出假设、验证效果。它不需要我告诉它”去检查一下表单转化”,它能从数据里自己看出来。这个闭环一旦建立,它就能持续优化,不是只改进一次。
第四,归因让决策有依据。在 UTM 标记之前,我不知道哪个渠道带来了流量,只能凭感觉调整策略。有了 UTM 标记之后,AI 能在周报里写”Twitter 的 thread campaign 带来了 10,445 sessions,WeChat share 逆势增长到 3,097”。有了这些数字,它建议的动作(把 WeChat 单独加 tracking,把 Twitter 按 R/T/N 分类运营)就都有数据支撑。
没效的部分。
第一,英文版内容的直接流量 ROI 很低。中文版文章的 PV 是英文版的 15-115 倍,英文版的 bounce rate 也更高。但英文版有一个间接价值:它们被 Google 和 AI 搜索引擎索引和引用。claude.ai 过来的 session duration 是全站最高的之一(500+ 秒)。所以英文版不应该放弃,但定位需要从”给英文读者看的翻译”改成”让 AI 能索引的语料”。这个判断本身也是 AI 分析数据后提出的。
第二,试图用 impressions 总量来评价 Twitter 内容质量。在 R/T/N 框架出来之前,AI 会用曝光量对帖子排序,但这个排法会把不带链接但曝光高的 Reach 帖排在前面,而实际带来站内流量的 Traffic 帖反而排后面。这是因为 Reach 帖的 hook 通常更泛、更容易触发算法推荐,但这不意味着它完成了增长目标。5 月切换到 R/T/N 复盘后,内容策略才真正和目标函数对齐。
第三,中文社交平台的投入产出不明确。知乎和 CSDN 的搬运几乎没有带来有效流量。微信公众号被专门评估过之后决定不开,因为维护成本和内容审核时间超过收益。微信群里发链接虽然 bounce 高,但胜在成本为零且偶尔有文章能触发自然传播。
这个分界需要写清楚,因为常见的叙述是”我用 AI 帮我写了文章”,实际情况不同。
我做的事情可以分为四类。第一类,付钱。AI 建议我开启 Typefully Creator 计划($12.50/月)用于自动调度 Twitter thread,升级 Twitter Premium 用于解锁完整 analytics 权限,维持 Kit 的付费计划用于 Newsletter 分发。这些是系统运行的基础成本,总共每月不到 $50。
第二类,帮它打通一个技术障碍。X 没有公开的 per-post analytics API,但 AI 需要单帖数据才能做内容层面的复盘。我帮它逆向出了 X 后台的 analytics 接口,把浏览器的 cookie 和 session token 喂给它。它在那个基础上自己封装了调用逻辑,然后就有了数据。这是我在这套系统里做的唯一一次技术介入,剩下的事情都是它自己完成的。
第三类,选题把关。AI 每天会在日报里列出一批候选选题,通常十几二十个。我会扫一眼,圈两三个让它去写,偶尔加一两句方向性的提示,比如”用这个视角来写”。这就是我日常全部的编辑工作,每天不超过两分钟。
第四类,偶尔校准分析框架。AI 会基于数据生成判断和建议,但每隔几周我会读一遍周报,确认它的判断方向没有跑偏。这个投入很小,每次大概 10 分钟。
除此之外,所有东西都是 AI 做的。GA4、GSC、Kit、Typefully 的调用脚本是它写的,UTM 标记规则是它定的,Thread 格式规范是它设计的,R/T/N 分类框架是它在分析数据之后自己提出来的,每周的增长报告从数据拉取到最终成文也是它完成的。
但这里最关键的,是它做事的模式本身就是一个闭环。AI 不是执行完一个任务就停在那里等着下一个指令。它每周拉数据、写报告、在报告里给出下一步建议,下一周再拉数据的时候会回头检查上周的建议有没有落地、落地之后数据有没有变化、变化是否符合预期。符合就继续,不符合就调整。Kit 表单延迟触发那个优化就是这么来的:它看到 bounce 偏高,提出假设,改了触发时机,然后在下一次报告里对比了改动前后的订阅转化率。整个”发现问题 → 提出方案 → 执行改动 → 验证效果”的循环,不需要我插手。
下面这张图概括了整个闭环。
这些东西如果让人工做,每周至少要花 5-10 个小时,而且很难保持固定的分析深度和判断标准。AI 的产量和一致性都更高。
yage.ai 是一个个人技术博客,读者画像清晰(中美两地的 AI/技术从业者),内容生产频率稳定(每 12 天一篇长文、每天一篇 Newsletter),分发渠道明确(Twitter + 微信 + Newsletter + 搜索)。这些条件让 AI 的运营难度不高:它面对的是一个确定性很强的系统,不需要处理太多边缘情况。
如果换到一个品类不同、受众更分散、内容形式更多样的项目上,AI 的能力边界在哪里?我的判断是:只要能把分发拆成确定性高的子任务(生成 thread、调度发布、拉取数据、对比指标、写报告),AI 就能在这个子任务上做得比人好。AI 的天花板不取决于它有多聪明,取决于你给它搭的工具箱子有多大。
但有一个东西 AI 做不了:它不会质疑你给它的分析框架。如果我说”每周 report 的 header 应该包含渠道对比表”,AI 会执行但不会反问”这个表真的是最重要的信息吗”。目前框架层面的判断仍然需要人来校准。这个限制不是模型能力的问题,是当前 Agent 系统普遍没有内置元认知。AI 能在给定框架里高效运行,但它不会主动检视这个框架本身是否合理。
过去三个月里,我花在这套增长系统上的时间加起来不到 10 个小时。主要是每天两分钟圈选题、每隔几周看一眼周报确认方向没跑偏。剩下的事:写脚本、跑数据、发内容、做归因、写报告,全是 AI 在自动执行。从投入产出比看,这套系统是目前我所有 AI 自动化项目里效率最高的一个。
它不性感,没有前端界面,没有产品 logo。它就是 AI 自己写的一堆 Python 脚本、几个 cron job、一个 prompt 集合和大量通过 API 流动的数据。但三个月过去,它把一个博客从周活 2,500 推到了 7,000,从零建立了 Twitter 账号和 Newsletter,从完全不懂渠道归因到每周能出一份多源交叉分析报告。全程我只做了四件事:付钱、帮它逆向了一个 API、每天圈选题、偶尔看方向。剩下的全是 AI 做的。