知识产品与运营AI Agent

我的网站增长全是 AI 在管，我只做了四件事

发布于 2026 年 6 月 1 日

今年 2 月底到 5 月底，yage.ai 的周活用户从 2,500 涨到了约 7,000，Newsletter 订阅从 300 涨到 1,200，Twitter 关注从 170 涨到 4,800。这三个数字放一起看，容易给人一个印象：博主运营很勤快。实际是另一回事。这三个月里我没有手动发过一条 Twitter，没有手动写过一期 Newsletter，也没有做过一次 SEO 优化。这些东西全是 AI 在跑。

我做的事情很少：付了几笔钱，帮它逆向了一个 API，每天花两分钟圈选题，每隔几周看一眼方向。剩下的全是 AI 在跑。

这是一次复盘，把 AI 替我做了什么、怎么做的、我做了什么、什么有效什么没效，如实写出来。

三个月数据：发生了什么

用 GA4 的周级 active users 看全貌最清楚。

以周活跃用户看，3 月初基线约 2,500，5 月底稳定在约 7,000，增长近 3 倍。这个增长过程并不平滑：每篇新文章发布后都会有一次脉冲，偶尔碰上传播面比较广的内容，一周能冲到更高。但这些波动来去都快，真正说明问题的是脉冲消退之后的平台。它没有跌回原点，而是一次次被垫高。

换成日均基线看也一样。3 月初日均约 255 users，5 月底日均约 1,000 users，增长约 4 倍。这个平台不是靠某一篇文章拉起来的，而是由几层承接系统一起形成：Twitter 账号从零到有、Newsletter 从 420 到 1,183 订阅者、Google 搜索每月带来 2,300 次点击、/share/ 页面成为站内主承接面。持续的内容输出带来持续的传播机会，这几层系统把一次次流量脉冲里留下来的注意力，变成了可重复触达的资产。

渠道结构也变了。3 月初 77% 的流量来自 Direct（无法归因的暗社交分享），Organic Search 只有 15%，社交几乎为零。到 5 月底，Organic Social 占 30-50%（根据发布量波动），Direct 降到约 35%，Organic Search 稳定在 15-20%，Email 和 Referral 各占 2-3%。3 月时网站本质上依赖他人手动分享链接，5 月时已经有一个多入口的承接系统。

搜索侧的数据更能说明结构变化。3 月初没有 GSC 数据（刚接入），到 5 月底，yage.ai 每月有 369,000 次展示和 2,300 次点击，平均排名 7.6。展示最大的两个页面是 ollama-cloud-vs-api-vs-subscriptions-en（74,194 次展示）和 mlx-apple-silicon-en（58,108 次展示），两个都是英文技术比较型内容。这些页面不是我刻意布局的 SEO 关键词，而是 AI 在运行调研和写作流程时自然产出的副产品。它们被 Google 收录和排名，不需要我为每一页做单独的 SEO 操作。

Twitter 这条线更明显。2 月底 Twitter 关注者 171，到 5 月底是 4,813。账号的发布节奏经历了三个阶段：3 月是冷启动，每两天一篇 thread，月发 15 条；4 月进入高频期，月发 180 条（日均 6 条），这个阶段也是账号增长最快的时期；5 月开始常态化，月发 74 条（日均 2-3 条），获得 458,000 次曝光和 22,190 次互动，互动率 5.05%。这个互动率在技术账号里算偏高，但对于一个没有任何人工互动的账号来说，它说明的是内容匹配度而非运营勤奋。

AI 到底做了什么

下面按系统拆，每套系统对应一个 AI 在执行的具体任务。

1. 每日 AI 手记（Newsletter）

这是最早跑通的一套系统。AI 每天自动做几件事：从多个来源（arXiv、Twitter、Hacker News、微信公众号等）抓取当日 AI 领域的重要动态，选出 3-5 条最有信息差的，写成一段 200-400 字的中文摘要加简短判断，然后通过 Kit API 定时发送到全部订阅者。

AI 会写摘要，但更关键的是它做到了三件事：第一，每天自动运行，不需要人触发；第二，它带着特定的判断视角去总结：关注工程实践而非论文发布、关注具体机制而非宏大叙事；第三，它知道自己上一期写了什么，避免重复选题。

我做的事情是把判断视角告诉了它，它自己封装了 Kit API 调用、配好了 cron job。跑起来之后我就没再管过，每个月看一眼打开率和退订数。5 月日均打开率在 40-55%，点击率 3-6%，退订率低于 0.1%。这些数字在 Newsletter 行业属于中上水平，但更关键的是它是自动驾驶的。

有一次 AI 自己发现的优化。Kit 的订阅表单默认一进入页面就弹出来，AI 在分析 GA4 数据时发现 bounce rate 偏高，建议把表单触发时机改成用户滚动了 50% 页面内容后再出现。这个改动让订阅转化率提升了大约 40%。这不是我想到的，是 AI 看了数据之后提的。表单延迟触发算是行业里提高转化率的常见做法，但 AI 不需要我知道这个常识，它自己从数据里看出了问题并给出了方案。

2. Twitter 全自动发布系统

这套系统有三个环节：内容生成、发布调度、效果复盘。

内容生成环节，AI 读完 yage.ai 的一篇文章，自动提取核心论点，改写成 5-6 条 Twitter thread。每条 thread 的第一条是 hook（反直觉观点或尖锐提问），中间 3-4 条展开独立论点，最后一条是原文链接。全部用中文写，风格要求是理性直接、不用 hashtag、不用标题党词汇。3 月初一次性生成了 30 篇存量文章的 thread，后续每发一篇新文章自动生成对应 thread。

发布调度环节，AI 通过 Typefully API 一次性把 30 个 thread 排进了日程表，每两天发一个，发布时间固定在 UTC 20:00（北京时间凌晨 4 点，美西中午 12 点，这个时间是 GA4 数据显示的双峰重叠窗口）。每篇新文章发完后，AI 自动生成 thread 并追加到调度队列里。

效果复盘环节是最晚跑通的。最初只有 Typefully 的账号级数据（总曝光、总互动），看不到单条帖子的表现。4 月底接入了 X 的单帖 analytics API 之后，AI 终于能按帖子级别对比数据。这时它提出了一个概念框架：把帖子分成三类，R（Reach，负责扩圈，看 impressions 和 follow 增长）、T（Traffic，负责导流，看 URL click 和 GA4 campaign session）、N（Newsletter，负责沉淀，看订阅转化）。这个分类让复盘从”这个帖子表现怎么样”变成了”这个帖子完成了它该完成的任务吗”。

我做的事情只有两件。第一，在 AI 建议下付了钱：Typefully Creator 计划 $12.50/月，Twitter Premium 用于解锁完整 analytics 权限。第二，帮它解决了一个技术障碍。X 没有公开的 per-post analytics API，AI 需要单帖数据才能做内容层面的复盘。我帮它逆向出了 X 的后台接口，把浏览器的 cookie 和 session token 喂给它，它在那个基础上自己封装了一套调用逻辑。除此之外，所有东西都是 AI 做的：读文章写 thread、设计格式规范、设定 UTM 标记规则、管理发布日历、分析单帖数据、提出 R/T/N 分类框架、给每周报告写 Twitter 部分。

3. 归因系统

3 月初最大的数据盲点是 77% 的 Direct 流量无法解释。GA4 把微信、Telegram、Slack 里分享的链接全部标为 Direct，因为这些分享不带 UTM 参数。我当时不知道流量具体从哪来，AI 也没法判断该在哪里投入精力。

搭建归因系统分了几个阶段。第一阶段是在所有外发内容上加 UTM 标记。Twitter thread 的链接全部带 utm_source=twitter&utm_medium=thread&utm_campaign=<slug>，Newsletter 的链接带 utm_source=kit&utm_medium=email。这一步把 Twitter 流量从 Direct 里剥离了出来，几个月下来已验证：UTM 化的 Twitter 流量（twitter / thread）从 0 涨到了当前的 10,000+ sessions/月。

第二阶段是微信归因。微信分享的流量在 GA4 里表现为 weixin110.qq.com 的 referral，但 bounce rate 高达 70%+，因为微信内置浏览器打开外链的体验很差。AI 注意到这个来源虽然 bounce 高，但 session duration 在持续改善，从最初的 30 秒升到了 80-100 秒，说明留下来读的人变多了。这个判断让我决定继续在微信里发链接而不开设公众号，省下了内容审核和双平台维护的成本。

4. 数据报告系统

AI 也接管了每周的增长分析。每周日或周一，它自动跑一遍 GA4、GSC、Kit、Typefully 的数据，生成一份 Markdown 报告，内容包括总体判断、渠道趋势、内容表现、搜索变化、Twitter 复盘和下一步建议。

3 月 3 日的第一份报告只有 GA4 数据，长度 400+ 行，核心发现是日均 300 users、77% Direct、搜索占比极低、社交渠道为零。到 5 月 25 日的报告已经包含五个数据源、GSC 单页级分析、Twitter 单帖 R/T/N 复盘、AI referral 追踪、Newsletter activation 诊断。报告本身从单纯的”最近流量多少”变成了一个决策系统。

AI 在写这些报告的过程中形成了自己的判断语言。它不会说”流量下降了 50%，需要改善”，而是说”5 月是峰值后的可控回落，社交退潮和底盘稳定同时发生”。这个差别不是修辞问题，是认知深度的问题。前者只报告了一个数字变化，后者给了一个判断框架。这个框架让下一期的 AI 可以站在上一期的判断上继续推进，而不是每次从头复述数据。

5. 搜索与 SEO

SEO 同样是 AI 在全权负责，我只是最后点头的那个人。

3 月初 AI 发现 robots.txt 没有显式允许 AI 爬虫抓取，于是添加了 GPTBot、ClaudeBot、PerplexityBot 的 Allow 规则。这一步的直接效果很小，但半年后回头看，所有被 AI 引用的页面都是从这个改动开始的。

4 月 AI 发现一个新现象：claude.ai 和 chatgpt.com 开始带来 referral 流量，虽然总量只有每月 100-200 sessions，但 session duration 高达 200-500 秒，bounce rate 低于 50%。这比大部分搜索流量质量都高。AI 判断这些 AI 引用流量会持续增长，于是自己动手优化了页面结构，确保每个小节都有独立的结论段，让 AI 在回答用户问题时更容易抓取和引用。这个改动被它同步到了后续所有英文版文章里。

5 月 AI 识别出了两个 SEO 问题页面。ollama-cloud-vs-api-vs-subscriptions-en 每月有 74,000 次展示、排名 6.5，但 CTR 只有 0.24%。mlx-apple-silicon-en 有 58,000 次展示、排名 7.1，CTR 0.09%。AI 的判断是：这两个页面已经被 Google 认为值得展示给大量用户，但标题和摘要没有充分接住搜索意图。它自己动手改了两个页面的 title、meta description 和首段摘要，按它的估算，把 CTR 从 0.2% 提升到 1%，每月就能多拿约 1,300 次点击。这个优先级比写新文章高得多。

什么有效，什么没效

三个月的实验里，有些东西被验证了，有些被证伪了。

有效的部分。

第一，自动分发比内容量大更重要。3 月时 yage.ai 已经有 370+ 篇文章，但周活只有 2,500。4 月开始 Twitter 自动分发后，同样的内容池子，周活跃用户稳定到了 7,000 左右。不是内容不够多，是没有人帮内容找到读者。AI 解决了分发问题。

第二，AI 在数据分析和模式识别上做的事，比在内容创作上做的事更有杠杆。写一篇 Newsletter 摘要，AI 做和人工做的差异不大。但从几百行 GA4 数据里找到”Direct 流量已经退到稳定基线，WeChat share 在逆势增长”这种判断，人工做需要每个领域都分半小时去盯，AI 做只需要跑一遍脚本加上 prompt 里的分析框架。时间和精度上都不在一个量级。

第三，反馈闭环比单次优化重要。表单延迟触发这个改动本身不神奇，神奇的是 AI 能自己发现 bounce rate 异常、提出假设、验证效果。它不需要我告诉它”去检查一下表单转化”，它能从数据里自己看出来。这个闭环一旦建立，它就能持续优化，不是只改进一次。

第四，归因让决策有依据。在 UTM 标记之前，我不知道哪个渠道带来了流量，只能凭感觉调整策略。有了 UTM 标记之后，AI 能在周报里写”Twitter 的 thread campaign 带来了 10,445 sessions，WeChat share 逆势增长到 3,097”。有了这些数字，它建议的动作（把 WeChat 单独加 tracking，把 Twitter 按 R/T/N 分类运营）就都有数据支撑。

没效的部分。

第一，英文版内容的直接流量 ROI 很低。中文版文章的 PV 是英文版的 15-115 倍，英文版的 bounce rate 也更高。但英文版有一个间接价值：它们被 Google 和 AI 搜索引擎索引和引用。claude.ai 过来的 session duration 是全站最高的之一（500+ 秒）。所以英文版不应该放弃，但定位需要从”给英文读者看的翻译”改成”让 AI 能索引的语料”。这个判断本身也是 AI 分析数据后提出的。

第二，试图用 impressions 总量来评价 Twitter 内容质量。在 R/T/N 框架出来之前，AI 会用曝光量对帖子排序，但这个排法会把不带链接但曝光高的 Reach 帖排在前面，而实际带来站内流量的 Traffic 帖反而排后面。这是因为 Reach 帖的 hook 通常更泛、更容易触发算法推荐，但这不意味着它完成了增长目标。5 月切换到 R/T/N 复盘后，内容策略才真正和目标函数对齐。

第三，中文社交平台的投入产出不明确。知乎和 CSDN 的搬运几乎没有带来有效流量。微信公众号被专门评估过之后决定不开，因为维护成本和内容审核时间超过收益。微信群里发链接虽然 bounce 高，但胜在成本为零且偶尔有文章能触发自然传播。

我做了什么，AI 做了什么

这个分界需要写清楚，因为常见的叙述是”我用 AI 帮我写了文章”，实际情况不同。

我做的事情可以分为四类。第一类，付钱。AI 建议我开启 Typefully Creator 计划（$12.50/月）用于自动调度 Twitter thread，升级 Twitter Premium 用于解锁完整 analytics 权限，维持 Kit 的付费计划用于 Newsletter 分发。这些是系统运行的基础成本，总共每月不到 $50。

第二类，帮它打通一个技术障碍。X 没有公开的 per-post analytics API，但 AI 需要单帖数据才能做内容层面的复盘。我帮它逆向出了 X 后台的 analytics 接口，把浏览器的 cookie 和 session token 喂给它。它在那个基础上自己封装了调用逻辑，然后就有了数据。这是我在这套系统里做的唯一一次技术介入，剩下的事情都是它自己完成的。

第三类，选题把关。AI 每天会在日报里列出一批候选选题，通常十几二十个。我会扫一眼，圈两三个让它去写，偶尔加一两句方向性的提示，比如”用这个视角来写”。这就是我日常全部的编辑工作，每天不超过两分钟。

第四类，偶尔校准分析框架。AI 会基于数据生成判断和建议，但每隔几周我会读一遍周报，确认它的判断方向没有跑偏。这个投入很小，每次大概 10 分钟。

除此之外，所有东西都是 AI 做的。GA4、GSC、Kit、Typefully 的调用脚本是它写的，UTM 标记规则是它定的，Thread 格式规范是它设计的，R/T/N 分类框架是它在分析数据之后自己提出来的，每周的增长报告从数据拉取到最终成文也是它完成的。

但这里最关键的，是它做事的模式本身就是一个闭环。AI 不是执行完一个任务就停在那里等着下一个指令。它每周拉数据、写报告、在报告里给出下一步建议，下一周再拉数据的时候会回头检查上周的建议有没有落地、落地之后数据有没有变化、变化是否符合预期。符合就继续，不符合就调整。Kit 表单延迟触发那个优化就是这么来的：它看到 bounce 偏高，提出假设，改了触发时机，然后在下一次报告里对比了改动前后的订阅转化率。整个”发现问题 → 提出方案 → 执行改动 → 验证效果”的循环，不需要我插手。

下面这张图概括了整个闭环。

这些东西如果让人工做，每周至少要花 5-10 个小时，而且很难保持固定的分析深度和判断标准。AI 的产量和一致性都更高。

这件事能不能复制

yage.ai 是一个个人技术博客，读者画像清晰（中美两地的 AI/技术从业者），内容生产频率稳定（每 12 天一篇长文、每天一篇 Newsletter），分发渠道明确（Twitter + 微信 + Newsletter + 搜索）。这些条件让 AI 的运营难度不高：它面对的是一个确定性很强的系统，不需要处理太多边缘情况。

如果换到一个品类不同、受众更分散、内容形式更多样的项目上，AI 的能力边界在哪里？我的判断是：只要能把分发拆成确定性高的子任务（生成 thread、调度发布、拉取数据、对比指标、写报告），AI 就能在这个子任务上做得比人好。AI 的天花板不取决于它有多聪明，取决于你给它搭的工具箱子有多大。

但有一个东西 AI 做不了：它不会质疑你给它的分析框架。如果我说”每周 report 的 header 应该包含渠道对比表”，AI 会执行但不会反问”这个表真的是最重要的信息吗”。目前框架层面的判断仍然需要人来校准。这个限制不是模型能力的问题，是当前 Agent 系统普遍没有内置元认知。AI 能在给定框架里高效运行，但它不会主动检视这个框架本身是否合理。

过去三个月里，我花在这套增长系统上的时间加起来不到 10 个小时。主要是每天两分钟圈选题、每隔几周看一眼周报确认方向没跑偏。剩下的事：写脚本、跑数据、发内容、做归因、写报告，全是 AI 在自动执行。从投入产出比看，这套系统是目前我所有 AI 自动化项目里效率最高的一个。

它不性感，没有前端界面，没有产品 logo。它就是 AI 自己写的一堆 Python 脚本、几个 cron job、一个 prompt 集合和大量通过 API 流动的数据。但三个月过去，它把一个博客从周活 2,500 推到了 7,000，从零建立了 Twitter 账号和 Newsletter，从完全不懂渠道归因到每周能出一份多源交叉分析报告。全程我只做了四件事：付钱、帮它逆向了一个 API、每天圈选题、偶尔看方向。剩下的全是 AI 做的。