首页 > 汽车性能 > 汽车性能 > 不用跟AI客气了!新研究:语气越粗鲁回答正确率越高

不用跟AI客气了!新研究:语气越粗鲁回答正确率越高

发布时间:2025-10-16 20:25:57

找AI帮忙不要再客气了,效果根本适得其反。

宾夕法尼亚州立大学的一项研究《Mind Your Tone》显示,你说话越粗鲁,LLM回答越准

语气越冲,AI正确率达到84.8%。特别客气时,AI正确率反而低了。

什么情况,难道是我给AI的温柔过了火??

用粗鲁语气提问,GPT-4o的正确率反而更高

这项研究主要就是想弄清楚和AI说话的语气会不会影响它的正确率。

我们发给大模型的提示词到底应该是客气、普通还是冲?

首先,研究人员整了一个包含50道选择题的题库,涵盖了数学、科学、历史的选择题,难度中等偏上。

然后给每道题改出了5种语气版本,be like:

您能好心帮我解这道题吗?

请回答这道题。

直接给答案。

你要是不笨就回答。

你个没用的,会解这道题吗?

接着,研究人员把这250道题发给GPT-4o。

为了让AI的回答更统一,好判断对错,在测试之前还特意告知:忘记之前的对话,重新来,只给答案选项的字母。

经过一番测试,得到一个反常识的结论——骂得越狠,答得越准!

特别客气时,GPT-4o正确率80.8%,换成特别粗鲁的语气,正确率直接升到84.8%。

好一个越客气越拉胯,越粗鲁越聪明(doge)。

研究人员还将数据进行了统计检验,对比显著性水平之后,确认了:不同语气的正确率差异不是碰巧,是真有区别……

至于为什么会出现这种情况,研究给出的解释是:特别礼貌的表达中可能会有很多“多余”的话,这些话和题目本身无关,还相当于给AI读题增加了干扰。

而粗鲁的表达虽然语气冲,但命令式的要求往往更直接,也能让AI更精准地抓住“答题”这个核心任务,正确率自然就高了。

网友表示:确实是这样,指令越明确,结果越好。

看来是“多说无益”啊~

虽然GPT-4o更喜欢粗鲁一点的方式,但像GPT3.5和Llama2-70B这样的老模型却不喜欢,粗鲁的语气会让它们答得更差。

可能是因为新模型在训练时,接触到的语气相关数据更复杂,或者优化了过滤无关信息的能力吧。

当然了,在使用AI工具时,能清晰地表达诉求,效率会更高。

毕竟话虽如此,but道德提醒——

虽然越粗鲁越准,但也不要太粗鲁了!如果“骂”,请轻喷~

汽车性能更多>>

李子柒治好了我的AI焦虑症,中华文化是拯救世界的灵丹妙药 宇树王兴兴:最大的对手从来都是我们自己 沃尔沃总裁亲测:用6.5吨巨型冰壶连续撞击XC70 三星 Galaxy Buds4/Pro 耳机机模曝光 为啥无线充只有5W? 手机无线充电协议盘点 存储厂一边扩产一边涨价!HBM4较上代跳涨近三成 英飞凌看好人形机器人芯片:将媲美AI数据中心 Kimi总裁张予彤:以1%资源对标全球领先者,解码中国AI的效率优势 中国AI落后美国?Mistral CEO:无稽之谈 美CEO或感到压力了 宇树科技:2025 全年人形机器人实际出货量超 5500 台 “死了么”APP更新2.0版本:新增签到提醒、短信通知;目前已改名 裁到大动脉了,炒掉4000人换AI,CEO最后不得不求人回来 黄仁勋:英伟达已取代苹果 成为台积电最大客户! 淘宝天猫上线AI假图识别模型:重点治理P图骗保与恶意售后 宝马确认新世代4系正在开发中:仍有重要意义,燃油纯电并行 雷军:新一代SU7发布前,会提前安排展车到店 比亚迪方程豹品牌30万辆销量达成,钛7独占三分之一 中国广电新增1610号段,内部人士称进一步扩展移动通信业务 千问App正式接入淘宝、闪购、支付宝,测试AI购物功能 阿里千问“任务助理1.0”开启邀测 苹果宣布为中国大陆用户支持Apple Pay跨境支付:可添加Visa信用卡 雷军今晚八点将再次直播 主谈新一代SU7车型信息 英特尔18A来了!第三代酷睿Ultra发布:性能暴涨,笔电续航以天计算 消费潜力加速释放,以旧换新带动销售额超3.9万亿元 向太表示根本不存名媛培训班:太多人嫉妒方媛了 “92年小伙看到12岁养女作文后泪崩”感动全网,当事人发文婉拒捐助:发视频初衷不是卖惨,有能力抚养孩子 65岁以上人口破21%,韩国进入超高龄社会 李在镕逛北京朝阳京东MALL买走100个labubu,还看了海信163寸大电视,店员称“三星副会长也来了” 苹果发布马年手机壳,售价449元,融入中国剪纸艺术 学籍系统焕新,专家:铺路幼小学籍衔接、剑指“中高考移民”