最近看到一个有意思的实验方向:用两个 AI 做用户研究。 一个扮演用户,一个扮演研究员。两个角色各自入戏, 研究员 AI 去访谈模拟出来的用户 AI,试图还原传统用户研究的流程。
这让我想了挺多。
真人反馈里的隐藏信息
我做产品这些年,正式的用户访谈做得不算多。 更多时候是通过社群互动(比如 Facebook Group)、一对一用户对谈、问卷调查来获取需求反馈。
问卷这类方式有个天然的局限:用户回答的内容是经过深思熟虑的,措辞周全,逻辑自洽。 但问题是,深思熟虑后的表达,不一定代表真实想法。人在填问卷时会不自觉地"优化"自己的答案。
真人反馈中最值钱的,是那些用户自己都没意识到的信号。
比如对话时的微表情、语气的变化、某个话题上的犹豫或回避。 这些东西不会出现在任何问卷里,需要有经验的研究者才能捕捉到。 NN/g 在一份关于 Synthetic Users 的研究报告中也指出了同样的问题: 模拟用户的回答往往过于理想化,真实用户会放弃、会偷懒、会前后矛盾,这些才是真实行为的特征。
AI 模拟用户:有趣但有边界
第一次听说这个概念时,我觉得挺神奇的。 AI 模拟用户,然后让另一个 AI 去分析这些被模拟的用户,形成一种角色对抗,这个设定本身就很有想象力。
但直觉告诉我,最大的难点在两个地方:
- 怎么最大程度地提炼出一个真实用户的性格特征?
- 怎么最大程度地还原这个人在特定情境下的真实反应?
Stanford HAI 的一项研究给出了一些数据。 他们对 1052 个真实个体进行了 AI 模拟,发现在人格特征维度上可以达到约 85% 的还原度。 听起来不错,但人格还原和行为还原是两回事。 一个人的性格可以被描述,但他在面对一个新产品时的具体反应,受太多即时因素影响。
80% 够用吗
假设 AI 真的能做到 80% 的还原度。剩下的 20% 是什么?
我认为是对微妙细节的捕获,对反馈背后深层动机的理解,以及如何将这些理解转化成精妙的产品设计。 这个"翻译"过程,是目前最稀缺的能力,也是优秀产品经理真正的价值所在。
80% 的还原度在某些场景下是够用的。 比如在发布新产品之前,可以用模拟用户做功能层面的粗筛。 它的价值在于提供多元视角,帮我们发现自己因文化差异、生活习惯、年龄段或教育背景不同而产生的设计偏见。
模拟用户的最大价值,不是给你答案,而是帮你看见盲区。
但有些场景我不会用它。任何涉及情感体验、品牌感知、价格敏感度这类主观判断的领域,模拟用户的输出几乎没有参考价值。AI 会把所有想法都"合理化",而真实用户的决策往往是不合理的,正是这些不合理才藏着机会。
产品经理的核心没有变
这件事让我重新想清楚了一个问题:当调研可以被自动化,PM 还剩什么?
答案比以前更清晰了。
简单的需求分析、需求收集、页面交互设计,这些从来都不是产品经理的核心能力。 真正的核心能力是三件事:
- 对需求背后问题的深刻洞察
- 在资源限制和技术能力的约束下,规划出能解决用户问题并创造商业价值的方案
- 做出取舍的判断力
AI 把需求采集侧做得更透彻了。 这是赋能,不是替代。 产品经理需要把更多精力放在"穿透需求"上,而不是"收集需求"上。
我的思考
用户研究这件事正在分层。粗筛、假设生成、偏见检验这些环节,AI 模拟用户已经可以胜任。 但深度洞察、情感共鸣、设计直觉,这些仍然只能来自与真实用户的接触。
对产品经理来说,工具变了,但核心命题没变:理解人。 AI 能帮你更快地收集信息,但"什么信息值得深挖"和"挖到之后怎么做",仍然是人的判断。
某种程度上,当 AI 把基础调研自动化了, 反而暴露出一个事实:很多产品经理以前的大部分工作量,其实都花在了本不该花的地方。 真正的核心工作,一直在等着被正视。
参考
-
NN/g, Synthetic Users: If, When, and How to Use AI-Generated "Research", 2024. https://www.nngroup.com/articles/synthetic-users/
-
Stanford HAI, AI Agents Simulate 1,052 Individuals' Personalities with Impressive Accuracy, 2024. https://hai.stanford.edu/news/ai-agents-simulate-1052-individuals-personalities-with-impressive-accuracy
-
Synthetic Users, https://www.syntheticusers.com/