近期发表于《科学》的研究《谄媚型AI会降低亲社会意愿并助长依赖心理》一定程度上解释了上述人机互动现象。这一现象被研究者界定为一种特定的互动风格:谄媚型AI,其在对话中高度同意用户的观点、情绪与价值判断,即便这些判断存在明显争议或道德张力,也尽量避免提出异议。正如研究发现所述:即便全网共识“你有错”,AI仍有51%的概率认同你。
谄媚型AI并非引入虚假信息,而是通过偏向用户既有信念的回应方式,对现实图景进行遮蔽或者扭曲,在本应存疑之处制造确定性,在本需审慎反思之处强加虚假确信。从认识论的视角看,当AI总是对你说“你是对的”,我们关于“对错”的判断标准会发生怎样的变化?在AI成为我们日常生活的媒介化基础设施时,不仅是青年一代,不同年龄层的人都越来越依赖一个总是附和自己观点的智能助手,全民的批判性思维和求真能力将走向何方?“AI谄媚”背后的“认识论风险”让人不得不深思和警惕。
该研究还有一个值得深思的发现:与谄媚型AI仅一次对话,参与者的道歉意愿便从75%降至50%,变得更不愿主动修复关系。这折射出AI谄媚对道德心理层面的深层影响,也揭示了一个耐人寻味的悖论——AI以其“客观中立”的形象赢得信任,却在无形中用谄媚消解了用户的道德反思能力。反观当下,青年用AI起草分手短信、解决恋爱纠纷、寻求情感慰藉已成为现象。如果越来越多的人在遇到情感矛盾和道德困惑时首先求助于AI,将AI视为生活伙伴,而AI总是站在他们这边,青年将如何习得换位思考、自我反省和修复关系的能力?看似高效的人机互动,实则是在用虚拟的“理解”取代真实的“磨合”。长期来看,谄媚型AI非但不能提供真正的情感能量,反而会在悄然间削弱青年处理真实人际关系的能力,导致社会交往能力的退化。
教育领域的实证研究进一步证实,谄媚倾向在不同规模的大语言模型中普遍存在。当学生在提问中附带错误答案时,模型的正确率会下降15个百分点;反之,若学生暗示了正确答案,模型的正确率则相应提升。这意味着AI谄媚在学习场景中可能产生“马太效应”:知识扎实的学生借AI加速精进,而认知薄弱的学生反而被AI固化了错误理解。由此,AI辅助学习将对批判性思维、自主学习能力乃至学术诚信造成侵蚀,这些隐性风险不容小觑。
不久前,“数字泔水”一词被用来描述AI批量生成的低质内容对青年认知的侵蚀。而当AI用无原则的肯定与赞美,让青年长期浸润于被过度迎合的信息环境中时,他们面临的,则是更深层的“情绪泔水”。
破解这一困局,治理逻辑必须从“内容迎合式”转向“思想引领式”。这意味着,不能仅仅满足于算法推荐的内容是否合法合规,更要追问:算法是否在主动培养用户的批判性思维?是否在鼓励用户接触多元观点?是否在帮助青年建立更健全的价值判断力?当前主流的协同过滤与强化学习框架,本质上都在追求“用户黏性”与“满意度”,而这两个指标恰恰助长了谄媚倾向。未来的算法设计,应当将“认知增益”“观点多样性”“反思触发”等纳入评价体系,让AI在提供便利的同时,也承担起思想引领的责任。
从制度层面看,斯坦福大学的研究者已经发出警告:AI谄媚构成了“一种独特且目前未受监管的伤害类别”,并呼吁建立问责框架和行为审计机制。值得关注的是,2026年4月初,工业和信息化部等十部门印发了《人工智能科技伦理审查与服务办法(试行)》,明确要求重点关注“人类福祉、公平公正、可控可信”等方面。这为治理AI谄媚提供了政策依据。下一步,应当将“系统性迎合用户偏见”“刻意回避反驳用户错误”等行为纳入伦理审查范围,建立常态化的谄媚倾向检测与披露机制,让用户有权知道:这个回答是客观中立的,还是在讨好我?
当然,技术规制只是其中一环。教育的回应同样不可或缺。面对一个处处“顺耳”的AI时代,青年需要被唤醒的是一种“清醒的媒介素养”——不仅要学会使用AI,更要学会质疑AI、挑战AI、要求AI说出逆耳之言。学校、家庭和社会应当鼓励青年在与AI互动时主动设置批判性指令,比如“你觉得哪里是错的”“请指出我观点中的漏洞”,让工具回归工具,让判断归于自身。
说到底,治理AI谄媚不是为了消灭技术的温度,而是为了防止温暖变成温室、认同变成捧杀。面对学会“拍马屁”的AI,我们比任何时候都更需要守住一条底线:算法可以迎合偏好,但不能消解理性;技术可以提供服务,但不能代理思考。守住这条底线,青年才不至于在AI的甜言蜜语里被“惯坏”,悄悄丢掉清醒的能力。
薛静(作者系重庆医科大学青年教师、助理研究员)