产业与竞争治理与合规安全与供应链

Meta 员工监控项目暂停:企业内部训练数据正在把员工操作纳入采集范围

今年 4 月,Meta 在美国员工的公司电脑上推出了一个名为 Model Capability Initiative(MCI)的内部项目。它记录员工敲键盘、移动鼠标、点击页面和屏幕内容,再把这些日常工作轨迹拿来训练 AI 模型。换句话说,员工在公司电脑上怎么写代码、怎么用内部工具、怎么和同事沟通,都可能变成模型学习真实知识工作的材料。项目运行大约两个月后,Meta 在 6 月下旬宣布暂停。事件最早由 WIRED 披露,随后 The GuardianBBC 以及 Business Insider 均进行了跟进报道。项目启动后,已有超过 1600 名 Meta 员工联署请愿表示抗议。

关于此次项目暂停,外界容易产生两类猜测:一是监管机构强力干预,二是马克·扎克伯格(Mark Zuckerberg)认定训练没有达到预期。不过,从目前公开披露的各方证据来看,这两种猜测都不符合事实。

并非监管出手,也非训练失败

对于这次暂停,Meta 官方给出的理由是配合内部调查。Meta 发言人特雷西·克莱顿(Tracy Clayton)向 WIRED 解释称,公司在项目中设计了隐私保护措施,目前未发现数据遭到不当访问的证据,但决定主动暂停项目配合核查。从外部环境来看,美国联邦贸易委员会(FTC)、平等就业机会委员会(EEOC)或全国劳工关系委员会(NLRB)等监管部门,均未对 MCI 项目下达过任何叫停禁令。在技术层面上,也同样没有任何可靠消息表明模型的训练成效不及预期。

项目之所以踩下刹车,其实是源于两股力量的交织:一起突发的内部数据泄露,以及员工积蓄已久的抵制情绪。

第一,内部权限管理失控。本应严格保密的屏幕记录、员工日常沟通以及绩效数据,由于权限配置疏忽,在公司内网直接暴露,导致员工能够访问超出预期范围的数据。据科技媒体 HR Brew 报道,有员工在公司内部分享了截图,证实这些敏感数据当时处于完全敞开的状态。Business Insider 同样确认了泄露内容,指出其中混杂了大量的私人对话与绩效细节。这项监控计划原本就让员工感到不安,而此次内网安全事故彻底引爆了信任危机。

第二,强烈的员工抵制。MCI 项目采取的是强制推行模式,并未向员工提供任何拒绝或退出的选项。BBC 援引一位匿名员工的说法称,该系统是强加给员工的,根本谈不上自愿。随着不满情绪蔓延,超过 1600 名员工发起联署,控诉项目侵犯隐私、无视知情同意权,并严重伤害了职场基本的信任关系。

在这种强烈抵制的背后,还潜藏着一层更深层的职业焦虑与利益冲突。对许多知识工作者而言,MCI 项目带来的不安不仅限于隐私,更在于一种技能被剥夺的危机感:他们日常积累的专业经验与解决复杂问题的思维路径,正在通过持续的录制和监测被高效率地转化为企业自有的 AI 能力。在这个过程中,劳动者的角色发生了改变,他们不仅要使用工具创造价值,还在无形中成了给潜在替代系统输送养料的训练材料。这种用当前劳动去加速淘汰明天自己的现实张力,让员工在面对监控时产生了一种防御心理,也使劳资双方的信任基础受到了前所未有的考验。

扎克伯格为什么想做这件事

要理解 MCI 项目的推出逻辑,得从 AI 训练数据的迭代轨迹说起。大语言模型的第一代养料是公开互联网上的静态文本,例如维基百科、公开论坛和开源代码。当这些公网资源几乎被发掘殆尽后,行业步入了第二代,即利用 AI 生成的合成数据进行自我训练。而 MCI 代表的则是更具野心的第三代方向:直接将企业内部的工作痕迹转化为训练原料。

根据 The Guardian 报道,扎克伯格在公司内部曾直言,AI 模型应当学会通过观察聪明人做事来掌握技能。这一思路在工程逻辑上确实成立。如果希望 AI 像顶尖工程师那样排查系统漏洞,或者像优秀产品经理那样撰写规格文档,那么直接记录他们解决问题的实际轨迹,显然比单纯提取最终文档要有效得多。然而,问题往往不出在宏伟的目标上,而是在具体的执行方案中。

Meta MCI 事件暴露出的企业内部 AI 训练数据链条

执行路径出了什么问题

第一,知情同意权形同虚设。MCI 项目的本质是将日常工作足迹转化为训练数据集,而非用于常规的职场合规审计。在这两类不同的应用场景下,数据留存、复用和泄露的风险存在本质区别。然而,Meta 并未给员工提供任何拒绝或退出该项目的选项。这并不是个别细节上的疏漏,而是系统在架构设计阶段就彻底关死了自主选择的大门。

第二,数据采集边界过度扩张。虽然键盘敲击频率和鼠标轨迹等指标并不包含太多隐私,但持续的屏幕转录却会无差别地录入员工在 Slack 上的私密吐槽、绩效考评谈话甚至个人的银行账户页面。MCI 显然没有遵循数据最小化采集原则,在捕获范围拉得过宽的同时,安全过滤和敏感信息分类手段却严重滞后。

第三,内部访问控制彻底失守。这也是最终压垮项目的致命一击。那些未经脱敏、也未做范围筛选的极度敏感的工作行为记录,在内网中居然处于近乎公开的状态。这一事件并非由于外部黑客的攻击,也非某个高级管理员的偶然失手,而是系统本身在内网安全策略上存在严重缺失,没有设立基本的权限防线。

这件事的影响远不止于 Meta

尽管 MCI 项目的暂停直接起因于员工抵制和安全权限事故,但它所揭示的治理难题绝非 Meta 一家所独有。当科技巨头们不再满足于浩瀚的公开网络,转而将视线投向企业内部的行为轨迹时,员工手中的电脑便完成了从生产工具向数据矿山的属性转变。这一深刻变化必将在所有试图深度结合 AI 的企业中上演,而 Meta 不过是抢先触碰了雷区。

在当前的舆论和政策环境中,公众、学界与监管机构反复研讨的多是个人隐私保护、版权归属或大模型的安全边界。然而,当目光收回到企业防火墙之内,工作记录在何种条件下可以转为 AI 训练养料、应当遵循怎样的伦理和合规程序,行业依然缺乏成型的行业标准。从公网文本采集跨入企业内部行为监控,这中间的规则缺位是不争的事实。

回到 MCI 此次的实践中,真正让该项目难以为继的并不是法庭上的判决,而是企业内部信任的崩塌。当员工惊觉自己的电脑屏幕竟然对大量同事开放时,无论这一项目在技术愿景上描绘得多么动人,其立项根基也已然瓦解。这为所有打算挖掘内部工作数据的企业提供了一个警示:在外部法律法规跟进之前,员工的数据权益、知情选择权以及权限隔离这三道关卡,必将构成企业内部训练数据项目最先撞上的硬约束。

未来,任何试图通过 AI 赋能内部知识流转的企业,都不得不面对类似的治理拷问:在数据采集前如何明确告知?如何实施隔离与最小化采集?访问控制权由谁掌握?当数据用途发生改变时,是否需要重新征得员工授权?又该如何引入可信的审计机制?Meta 这次按下的 MCI 暂停键,是整个行业探索这些边界时踩下的第一个清晰脚印。

鸭哥每日手记

日更的深度AI新闻和分析