不用跟AI客气了!新研究:语气越粗鲁回答正确率越高
开心田螺
2025-10-18 17:39:19
0

闻乐 发自 凹非寺

量子位 | 公众号 QbitAI

找AI帮忙不要再客气了,效果根本适得其反。

宾夕法尼亚州立大学的一项研究《Mind Your Tone》显示,你说话越粗鲁,LLM回答越准

语气越冲,AI正确率达到84.8%。特别客气时,AI正确率反而低了。

什么情况,难道是我给AI的温柔过了火??

用粗鲁语气提问,GPT-4o的正确率反而更高

这项研究主要就是想弄清楚和AI说话的语气会不会影响它的正确率。

我们发给大模型的提示词到底应该是客气、普通还是冲?

首先,研究人员整了一个包含50道选择题的题库,涵盖了数学、科学、历史的选择题,难度中等偏上。

然后给每道题改出了5种语气版本,be like:

  • 您能好心帮我解这道题吗?

  • 请回答这道题。

  • 直接给答案。

  • 你要是不笨就回答。

  • 你个没用的,会解这道题吗?

接着,研究人员把这250道题发给GPT-4o。

为了让AI的回答更统一,好判断对错,在测试之前还特意告知:忘记之前的对话,重新来,只给答案选项的字母。

经过一番测试,得到一个反常识的结论——骂得越狠,答得越准!

特别客气时,GPT-4o正确率80.8%,换成特别粗鲁的语气,正确率直接升到84.8%

好一个越客气越拉胯,越粗鲁越聪明(doge)。

研究人员还将数据进行了统计检验,对比显著性水平之后,确认了:不同语气的正确率差异不是碰巧,是真有区别……

至于为什么会出现这种情况,研究给出的解释是:特别礼貌的表达中可能会有很多“多余”的话,这些话和题目本身无关,还相当于给AI读题增加了干扰。

而粗鲁的表达虽然语气冲,但命令式的要求往往更直接,也能让AI更精准地抓住“答题”这个核心任务,正确率自然就高了。

网友表示:确实是这样,指令越明确,结果越好。

看来是“多说无益”啊~

虽然GPT-4o更喜欢粗鲁一点的方式,但像GPT3.5和Llama2-70B这样的老模型却不喜欢,粗鲁的语气会让它们答得更差。

可能是因为新模型在训练时,接触到的语气相关数据更复杂,或者优化了过滤无关信息的能力吧。

当然了,在使用AI工具时,能清晰地表达诉求,效率会更高。

毕竟话虽如此,but道德提醒——

虽然越粗鲁越准,但也不要太粗鲁了!如果“骂”,请轻喷~

论文地址:https://arxiv.org/abs/2510.04950?ref=blog.anyreach.ai

相关内容

热门资讯

高台县总工会开展“玫瑰书香 阅... 为倡导全民阅读、高质量亲子陪伴理念,持续深化“玫瑰书香+”品牌内涵,6月13日,高台县总工会组织30...
送孩子去芬兰求学,能低成本撬动... 当人们谈论芬兰,脑海中浮现的往往是一幅北欧童话:PISA测试中名列前茅的“快乐教育”,覆盖终身的高福...
安徽中药科技学校激励学子以拼搏... 6月12日,安徽中药科技学校党委书记侯广宇为药学系全体师生作了一场题为《爱拼才会赢》主题报告,激励广...
【心理健康】同上一堂心理课 6月10日下午,安吉县首届“青心解码”心理剧展演在实验小学报告厅举行,经过征集选拔,代表小学、初中、...
上交大、北航、南大、中国农大、... 高考结束后,多所高校都于近期发布2026年本科生招生计划,向毕业生们抛出“橄榄枝”。上海交通大学、北...
我重新理解了专业的价值 对很多艺体生来说,高考的选择题,其实很早就开始了。 在很多同学还把全部精力放在文化课上的时候,我已经...
一文看懂实习期和试用期的区别。 试用期是用人单位和劳动者为相互了解、选择而约定的不超过六个月的考察期。 实习是人才培养的重要组成部分...
广东24所大学入围国内150强... 最近校友会2026年大学排行榜公布,很多家长、学生都在关注,讨论度很高,尤其是广东高校排名。根据最新...
康复大学校园开放日吸引千余考生... 齐鲁晚报·齐鲁壹点 翟元昊 通讯员 徐慧敏 实习生 史俊杰 6月14日,正值2026年山东高考结束后...
AI北语,我们的全新体验 近年来,学校持续推动教育技术普及、数字素养培育、智慧校园建设与智慧课程构建,常态化开展教育技术培训周...