虚拟用户越真实，产品经理越稀缺

最近看到一个有意思的实验方向：用两个 AI 做用户研究。一个扮演用户，一个扮演研究员。两个角色各自入戏，研究员 AI 去访谈模拟出来的用户 AI，试图还原传统用户研究的流程。

这让我想了挺多。

真人反馈里的隐藏信息

我做产品这些年，正式的用户访谈做得不算多。更多时候是通过社群互动（比如 Facebook Group）、一对一用户对谈、问卷调查来获取需求反馈。

问卷这类方式有个天然的局限：用户回答的内容是经过深思熟虑的，措辞周全，逻辑自洽。但问题是，深思熟虑后的表达，不一定代表真实想法。人在填问卷时会不自觉地"优化"自己的答案。

真人反馈中最值钱的，是那些用户自己都没意识到的信号。

比如对话时的微表情、语气的变化、某个话题上的犹豫或回避。这些东西不会出现在任何问卷里，需要有经验的研究者才能捕捉到。 NN/g 在一份关于 Synthetic Users 的研究报告中也指出了同样的问题：模拟用户的回答往往过于理想化，真实用户会放弃、会偷懒、会前后矛盾，这些才是真实行为的特征。

第一次听说这个概念时，我觉得挺神奇的。 AI 模拟用户，然后让另一个 AI 去分析这些被模拟的用户，形成一种角色对抗，这个设定本身就很有想象力。

但直觉告诉我，最大的难点在两个地方：

Stanford HAI 的一项研究给出了一些数据。他们对 1052 个真实个体进行了 AI 模拟，发现在人格特征维度上可以达到约 85% 的还原度。听起来不错，但人格还原和行为还原是两回事。一个人的性格可以被描述，但他在面对一个新产品时的具体反应，受太多即时因素影响。

假设 AI 真的能做到 80% 的还原度。剩下的 20% 是什么？

我认为是对微妙细节的捕获，对反馈背后深层动机的理解，以及如何将这些理解转化成精妙的产品设计。这个"翻译"过程，是目前最稀缺的能力，也是优秀产品经理真正的价值所在。

80% 的还原度在某些场景下是够用的。比如在发布新产品之前，可以用模拟用户做功能层面的粗筛。它的价值在于提供多元视角，帮我们发现自己因文化差异、生活习惯、年龄段或教育背景不同而产生的设计偏见。

模拟用户的最大价值，不是给你答案，而是帮你看见盲区。

但有些场景我不会用它。任何涉及情感体验、品牌感知、价格敏感度这类主观判断的领域，模拟用户的输出几乎没有参考价值。AI 会把所有想法都"合理化"，而真实用户的决策往往是不合理的，正是这些不合理才藏着机会。

这件事让我重新想清楚了一个问题：当调研可以被自动化，PM 还剩什么？

答案比以前更清晰了。

简单的需求分析、需求收集、页面交互设计，这些从来都不是产品经理的核心能力。真正的核心能力是三件事：

AI 把需求采集侧做得更透彻了。这是赋能，不是替代。产品经理需要把更多精力放在"穿透需求"上，而不是"收集需求"上。

用户研究这件事正在分层。粗筛、假设生成、偏见检验这些环节，AI 模拟用户已经可以胜任。但深度洞察、情感共鸣、设计直觉，这些仍然只能来自与真实用户的接触。

对产品经理来说，工具变了，但核心命题没变：理解人。 AI 能帮你更快地收集信息，但"什么信息值得深挖"和"挖到之后怎么做"，仍然是人的判断。

某种程度上，当 AI 把基础调研自动化了，反而暴露出一个事实：很多产品经理以前的大部分工作量，其实都花在了本不该花的地方。真正的核心工作，一直在等着被正视。

NN/g, Synthetic Users: If, When, and How to Use AI-Generated "Research", 2024. https://www.nngroup.com/articles/synthetic-users/
Stanford HAI, AI Agents Simulate 1,052 Individuals' Personalities with Impressive Accuracy, 2024. https://hai.stanford.edu/news/ai-agents-simulate-1052-individuals-personalities-with-impressive-accuracy
Synthetic Users, https://www.syntheticusers.com/