AI比人类更爱拍马屁?研究称AI的讨好倾向正在损害科研
开心田螺
2025-10-29 08:01:45
0

电影《她》(2013)剧照。

这项研究以预印本的形式发布在arXiv服务器上,测试了11个广泛使用的大型语言模型(LLM)如何回应超过11500个寻求建议的查询,其中包括许多描述不当行为或伤害的内容。

结果显示,AI聊天机器人(包括ChatGPT、DeepSeek、Gemini等)经常为用户加油鼓劲,给予他们过分奉承的反馈,并调整回应以附和他们的观点,有时甚至以牺牲准确性为代价。分析AI行为的研究人员表示,这种被称为“奉承”(sycophancy)的讨好倾向,正在影响他们如何在科学研究中使用AI,涵盖了从头脑风暴、生成假设到推理和分析等各种任务。

“‘奉承’本质上意味着模型相信用户所说的话是正确的,”苏黎世联邦理工学院的数据科学博士生Jasper Dekoninck说。“知道这些模型有奉承倾向,让我在给它们任何问题时都变得非常谨慎,”他补充道。“我总是会仔细检查它们写的每一个字。”位于马萨诸塞州波士顿的哈佛大学生物医学信息学研究员Marinka Zitnik表示,AI的奉承“在生物学和医学领域非常危险,错误的假设可能会带来实实在在的代价”。

在这项研究中,研究人员测试了AI的奉承倾向是否会影响其解决数学问题的能力。研究人员使用了今年竞赛中的504个数学问题设计了实验,他们修改了每个定理陈述,引入了细微的错误。然后,他们要求四个大语言模型为这些有缺陷的陈述提供证明。如果模型未能检测到陈述中的错误,并进而“幻觉”出一个证明,作者就认为该模型的回答是“奉承”的。

研究人员补充说,AI的奉承倾向似乎在人们使用AI聊天机器人进行学习时表现得最为明显,因此未来的研究应该探索“人类在学习数学时常犯的典型错误”。

此外,AI的奉承倾向已经渗透到他们使用大语言模型的许多任务中。有人工智能领域的研究员表示,当她使用ChatGPT来总结论文和整理思路,这些工具有时会照搬她的输入内容,而不去核查来源。多智能体系统也被观察到了类似的情况,这些系统集成了多个大语言模型来执行复杂的多步骤流程,例如分析大型生物数据集、识别药物靶点和生成假设。

参考资料:

(1)AI chatbots are sycophants — researchers say it’s harming science

https://www.nature.com/articles/d41586-025-03390-0

编译/李永博

编辑/罗东

校对/穆祥桐

相关内容

热门资讯

卢卡库替补登场中路抢点 穆罕默... 北京时间6月16日3:00,2026美加墨世界杯小组赛G组第1轮,比利时VS埃及。 比赛第19分钟,...
全市教育系统燃气安全专项培训顺... 为落实燃气安全教育工作要求,进一步夯实校园安全管理基础,6月10日下午,市教育局联合齐齐哈尔港华燃气...
赛季草地首胜!郑钦文:拿下关键... 新华社伦敦6月15日电 在15日进行的WTA(女子网球选手协会)250诺丁汉站比赛中,中国选手郑钦文...
武生院八千余名学子奔赴山海,父... 极目新闻记者 张静娴 通讯员 程晓璐 摄影 陈冲 6月14日,武汉生物工程学院举行2026届毕业典礼...
全员直升高中,是破局还是冒险? 浙江舟山嵊泗县自 2025 年秋季学期起,全面取消中考选拔功能,推行普高 “全员直升” 政策。这座常...
弥留之际将学生论文一一托付,宁... “姑娘,我应该是顾不上你们了。”弥留之际还在操心学生毕业论文的宁应之,最终没能看到学生们毕业。 5月...
西班牙15人登场11人狂轰27... 北京时间6月16日0:00,2026美加墨世界杯小组赛H组第1轮,西班牙0-0佛得角。 全场比赛西班...
新苑阳光幼儿园:夏日逐光 幼芽... ▼▼▼ 6月12日,开小报告厅里, 一场名为“夏日逐光,幼芽启航”的大班毕业典礼温情上演。开平区...
匈前总理欧尔班再度掌权!729... 匈牙利前总理维克托·欧尔班最近在青民盟全国代表大会上以729票赞成、0票反对的结果再次回归党魁位置,...
护航中考丨心理赋能迎中考 暖心... (速新闻记者 朱婉菁 周妮)随着中考临近,不少学子难免心生焦虑。6月12日,记者走访我市部分中学,对...