AI RegulationPrivacy

ChatGPT Dreaming V3 的合规死结

发布于 2026 年 6 月 7 日

6 月 4 号，OpenAI 发布了 Dreaming V3。ChatGPT 的新一代自动记忆架构。每次聊完天，一个后台进程自动启动，读完你全部对话历史，合成一份包含你的偏好、项目状态、时间上下文的用户画像。不需要你触发，不需要你确认。计算效率提了五倍，第一次向 Free 用户开放。OpenAI 的博客里放了三组对比案例：有记忆的 ChatGPT 能认出用户的相机装备去推荐匹配的配件，能记住用户是素食主义者去给饮食建议，能根据用户已经离开新加坡自动调整推荐餐厅的位置。差距直观。

但 OpenAI 没写在博客里的是，它记错的时候是什么样的。

ChatGPT 的记忆功能，我用了两周就关了。它记错了。我和它讨论过一次植物性饮食的尝试，两周以后还在给我推素食餐厅。我已经吃回正常饮食了，但它不知道。它手里有一份关于我的过期档案，照着那个执行。

Reddit 上有个用户，之前用 ChatGPT 逐句翻译柏拉图，每条笔记详细标注了不同译本的差异。Dreaming V3 升级后，所有笔记被压成一句话：“User has shown interest in careful readings of Plato。”

信任这个东西有个特点。它不像产品的其他指标那样”逐渐变好”。70% 的正确率，对工程师是”还不错”。对用户是”30% 都错了，我还能信什么”。一个在后台静默运行、持续更新关于你的画像、而你全程不知情的系统，只要错几次，信任就被耗光了。用户不会投诉，不会改设置，只会默默关掉。

我自己就是这样关掉的。它记错了几次关于我的事。我找不到是哪段对话导致的，也碰不到它得出那个结论的路径。

但这个信任问题不是 Dreaming V3 独有的。要理解它为什么是自动记忆这个品类内生的设计层面的缺陷，我们得先看三家大模型公司是怎么走到今天的。

入场最晚的领跑者

Dreaming V3 发布那几天，讨论量把 Claude 和 Gemini 都盖过去了。很多人因此误以为 OpenAI 是这条路上跑得最快的。但实际上，在自动背景记忆这条线上，OpenAI 是三家里面最后一个。

ChatGPT 最早有记忆功能。2024 年 4 月就上线了，但那是手动的。用户得自己说”记住这个”，系统才把它存进一个列表。像一个人只记了你写在便签上的事，其余全忘。这套机制的另一个问题是记忆会过时：你告诉它”我在新加坡，推荐今晚的餐厅”，它把这个事实永久保存了。等你两周后回到加州，它还在给你推荐新加坡的外卖。2025 年 4 月，OpenAI 加了一层 Dreaming V0，一个后台进程，让模型能从聊天历史里捞上下文，给手动保存的记忆做补充。但它只是辅助。主力还是手动。

真正第一个把自动记忆做成独立产品的，是 Google。

2025 年 8 月，Gemini 推出了 Personal Context。系统默认开启，后台自动从用户所有历史对话里学习偏好和兴趣，跨会话持续演化。不再需要用户说”记住”。系统自己判断什么该记住。Google DeepMind 的 Gemini App 产品负责人 Michael Siliski 在博客里写，要创造一个”不是对每个人都用同样方式回复的 AI 助手”。

Anthropic 在 2025 年 8 月也推出了一版跨会话记忆，但要用户主动要求 Claude 去引用之前聊过的话。到了 2026 年 5 月，Anthropic 发布了 AutoMemory，后台自动从对话中提取、去重、整理项目和偏好信息，写入一个用户可以查看和编辑的文件里。它的透明度和可编辑性在三家里面最高。

OpenAI 的 Dreaming V3 排第三。2026 年 6 月 4 号上线。把之前辅助性的 Dreaming 升级为独立记忆系统：每次聊完，后台自动合成偏好、项目状态、时间上下文。不再需要任何触发。效率提了五倍，第一次给 Free 用户开放。Plus 和 Pro 存储翻倍。

三家走了不同的技术路径：Google 走平台集成（你的邮件、日历、文档是 ground truth），Anthropic 走用户可见的文件式透明路线，OpenAI 走最彻底的低控制高便利路线。不问、不让你看、自己在后台跑。但三家迟早都在往同一个方向跑：让 AI 自己决定该记住你什么。

然后欧洲把这整条路拦住了。

三家在欧洲同时缺席

Dreaming V3 没对欧洲经济区、瑞士和英国开放。Google 的 Personal Context，没开。Claude 的 AutoMemory，也没开。

三家做自动记忆，三家在欧洲集体缺席。

这不是什么可以忽略的边角市场。欧盟有 4.5 亿人口，GDP 和美国相当。OpenAI 开发者论坛上，一个被顶到最高的帖子标题是：“So OpenAI’s solution to the EU’s privacy laws is to lock us out entirely?” 帖子里写：“他们在 EEA、UK、瑞士、挪威、冰岛、列支敦士登全部禁用了记忆功能，还在收我们全额费用。” 管理员的回复只有一句：“该功能在欧盟和瑞士不可用。”

Gemini 的帮助社区里情况一样。一个用户在 2025 年 12 月发帖问为什么自己的”Personal context”开关找不到。Product Expert 回复说，这个功能对 Workspace 企业账户不可用。即便个人账户的那些，也有一长串排除了的国家。

缺席的原因很清楚，在法律条文里。

法律条文不复杂，产品很难

8 月 2 日生效的 EU AI Act 第 50 条，要求所有直接跟人交互的 AI 系统提供透明度：用户必须知道自己在跟 AI 交互，必须能够理解系统在做什么。这个要求的范围极广。不限制于”高风险”系统，所有 AI 产品都适用。欧盟委员会 2026 年 5 月发布的草案指引进一步要求”全生命周期的透明度设计”。

同时，GDPR 第 4(4) 条对”画像”的定义为：“对个人数据进行自动化处理以评估其个人特征，特别是工作表现、经济状况、健康、个人偏好、兴趣、可靠性和行为。” 自动记忆做的恰好是这件事：读取对话历史、评估用户偏好和兴趣、生成持久化的用户模型。在法律表述上，几乎没有不落入画像定义的空间。

一旦被划为画像，GDPR 以下条款全部触发。第 13-14 条，用户必须被告知画像的存在、逻辑和预期后果。第 15 条，用户有权访问画像数据。第 16 条，用户有权纠正不准确的推断。第 17 条，用户有权要求删除。第 21 条，用户有权拒绝被画像。第 35 条，由于涉及新技术和大规模处理，几乎必然需要完成数据保护影响评估。

不是某一条，是全套。

让自动记忆好用的三件事，是这些法律的直接打击目标。不问你。触发知情权和反对权。后台自动合成。触发画像定义和 DPIA。跨会话持续演化。让数据最小化和目的限制在严肃解释下站不住脚。三条支柱，三条义务触发线。

一般的产品矛盾可以靠取舍解决。隐私和便利是取舍：你要更精准的推荐，就少要一点隐私。两者背向而行，你在中间找个位置。

自动记忆的矛盾不是取舍。你越让它自动，合规暴露就同步扩大，因为让自动变好的那三个机制恰好就是法律要求披露和控制的那三条。两者不是背向而行，是绑在一起朝同一个方向走。你做更多 A，自动在做更多反 A。同一个产品价值主张，就是合规风险的制造机制。

一个记忆摘要页面加上逐条删除和开关，从合规 checklist 上可能满足最低要求。但这种版本的产品，和 OpenAI 发布会上”不需要你做任何事，它会自己了解你”的那个产品，还有多大的重合。

上面的讨论是抽象的。讲的是法律逻辑和产品逻辑怎么撞在一起。但在真人数据上，自动记忆到底在记什么，有没有独立证据？有一份。

论文说了什么

今年 2 月，一组来自德国和荷兰的研究者在 arXiv 上发了一篇论文（arxiv:2602.01450），后来被 ACM Web Conference 2026 接收。标题是 The Algorithmic Self-Portrait: Deconstructing Memory in ChatGPT。论文的方法很直接：通过 GDPR 数据访问权，从 80 名 ChatGPT 用户那里拿到了完整的聊天历史加全部存储记忆，每人至少 100 次对话。总共 1,058 段对话、22,971 个 query、2,050 条记忆。

研究拆了四个维度。合起来看，四个维度构成了一条链：系统在你不知情的情况下，建了一份关于你的档案，这份档案不仅记了你说了什么，还推断了你是什么样的人，而且记得很准。

第一个维度，谁在控制。96% 的记忆是系统单方面创建的，只有 4% 由用户主动触发。这意味着这不是一个你使用的功能，是一个在你身上运行的后台进程。你不是在教 AI 记住你。你在被 AI 记录。

第二个维度，记了什么。28% 的记忆包含 GDPR 定义下的个人数据，7% 属于”特殊类别数据”：健康、性取向、政治观点等。姓名出现在 41% 的记忆中。不是只记了你喜欢什么口味的披萨。

第三个维度，还在推断。研究者按 Theory of Mind 框架做了分类。52% 的记忆包含心理层面的内容：Desires，用户想要什么，73%；Intentions，用户打算做什么，16%；Emotions，情绪，14%；Beliefs，信念，11%。97% 的参与者至少有一条心理推断被系统记录。论文里那句话把这事概括得很准：“ChatGPT’s memory may encode not only who the user is, but also how the user thinks and feels。”

第四个维度，准不准。84% 的记忆和源对话忠实对应。这个数字容易被读反。如果记不准，你可以说系统在胡编：功能烂，不值得用。但它是准的。这意味着前面三条不是系统故障，是系统按照设计做到了它被要求做的事。它在你不在场的时候，建了一份准确的、包含敏感内容的、连你的心理倾向都标注好的、关于你的档案。

研究者还试了一件事：拿开源模型去反向工程 ChatGPT 的记忆提取逻辑，看看如果对所有 query 都提取记忆会怎样。结果敏感信息比例从 28% 升到 35%。这说明 ChatGPT 已经在做过滤了，但过滤的标准是什么，你没有渠道知道，也没有开关控制。

你赌的是什么

三家公司，三家做自动记忆，三家在欧洲碰壁。如果只是一家被卡，是那家的问题。三家都被卡，是产品设计的前提本身跟法律框架不兼容。

我说的不是”合规太难”。我说的更简单：自动记忆如果按现在的定义来做，不问、不让你看、自己在后台跑，它在任何严肃的隐私法规下都做不到完全合规。做不到，因为定义上就做不到。把”不问你”三个字写进产品架构的那一天，合规缺口就已经写进去了。

这里还有一个更大的赌注。三家公司赌的都是同一件事：用户会为了”AI 懂我”的便利，接受 AI 在一个看不见的地方持续替自己做判断。赌对了，自动记忆会是留存最强的功能。赌错了，用户一旦意识到那个看不见的判断可能不准、可能改不了、可能比自己以为的更大地影响自己的体验，那它就不是引擎，是流失最快的入口。

我自己赌输了。是它推的那几家素餐厅，推得实在太久了。