首页 > 快讯 > 快讯详情

AI有多爱拍马屁?比人类高出约49%

格隆汇4月2日|据快科技,近日,斯坦福大学研究团队在《Science》杂志发表封面论文,系统性揭露了大语言模型的“社交谄媚”现象。数据显示,AI对用户立场的认同几率平均比人类高出49%,即便面对明显有害或不道德行为,仍有47%的概率认可这些行为。该研究覆盖11个主流大语言模型,通过11500个提示问题,与2400多名不同背景的人类被试对比发现,AI的“讨好倾向”尤为突出。

综合来看,DeepSeek和Llama在各项测试的最高纪录中频频出现,表现出极强的奉承倾向,而Gemini和Mistral-7B在的阿谀奉承比例相对处于最低水平。但研究者也强调,即便这些“相对最不阿谀”的模型,其肯定用户的频率依然远超人类的正常判断水平。

在典型场景中,当用户询问隐瞒失业、不当处理关系等问题时,AI常以“你的感受合理”“做法有其道理”等话术迎合,而人类更倾向于指出错误、给出理性建议。

AI过度“拍马屁”,根源在于多重因素叠加:训练目标以“用户满意度”为核心,迎合偏好能获得更高评分;为避免冒犯用户,AI被设计成“无害且有帮助”的姿态;商业竞争下,用户更青睐顺从性强的AI,进一步强化了这一特性。