关闭广告

新研究发现 AI 的最大破绽:不是不够聪明,而是不会“骂人”

IT之家1593人阅读

IT之家11月8日消息,科技媒体Ars Technica今天(11月8日)发布博文,报道称最新研究称AI模型在社交媒体上极易被识破,其致命弱点竟是“过于礼貌”。

苏黎世大学、阿姆斯特丹大学、杜克大学和纽约大学的研究人员于近日联合发布报告指出,在社交媒体互动中,AI模型因其过于友好的情感基调而极易暴露身份。

研究团队开发的自动化分类器在 Twitter/X、Bluesky 和Reddit三大平台上进行测试,识别AI生成回复的准确率高达70% 至80%。这意味着,当你在网上遇到一个异常礼貌的回复时,对方很可能是一个试图融入人群却以失败告终的AI机器人。

为量化 AI 与人类语言的差距,该研究引入了一种名为“计算图灵测试”的新框架。与依赖人类主观判断的传统图灵测试不同,该框架运用自动化分类器和语言学分析,精准识别机器生成内容与人类原创内容的具体特征。

研究团队负责人、苏黎世大学的尼科洛・帕根(Nicolò Pagan)表示,即便校准相关模型,其输出内容仍在情感基调和情绪表达上与人类文本存在明显区别,这些深层情感线索成为识别AI的可靠依据。

研究的核心发现被称为“毒性特征暴露”。团队测试了包括Llama 3.1、Mistral 7B、Deepseek R1,Qwen 2.5在内的九款主流开源大语言模型。






相关研究内容

当被要求回复真实用户的社交媒体帖子时,这些AI模型始终无法达到人类帖子中常见的那种随意的负面情绪和自发的情感表达水平。在所有三个测试平台上,AI生成内容的“毒性”分数(衡量攻击性或负面情绪的指标)始终显著低于人类的真实回复。

为了弥补这一缺陷,研究人员尝试了多种优化策略,例如提供写作范例或进行上下文检索,以求在句子长度、词汇数量等结构性指标上更接近人类。然而,尽管这些结构差异有所缩小,情感基调上的根本差异依然顽固存在。这表明,让AI学会像人一样“不那么友好”,可能比让它变得更聪明还要困难。

IT之家附上参考地址

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

11月7日正式预售 零跑Lafa5将于广州车展上市

网易汽车 浏览 1704

票房从13.65亿跌到1730万,我五味杂陈:这块金字招牌算是砸了

靠谱电影君 浏览 1910

空客天津第二总装线投产,高端航空制造产业集群成型

华夏时报 浏览 1876

官方:原海港、深足康复师克雷顿加盟广州豹,能用汉语沟通

懂球帝 浏览 845

《时代》周刊2025年度人物公布:“AI建设者”

IT之家 浏览 1302

终于!Windows 11迎来蓝牙音频共享功能:可惜还是有限制

快科技 浏览 1721

大连海鲜成双十一最热销特产之一 海参大虾扇贝备受追捧

半岛晨报 浏览 1580

杨紫扛剧女王不是白叫的,顶流胡歌也得给她作配

大黑爱旅游 浏览 939

杭州一区拟推出“养龙虾”十条!支持OpenClaw&OPC-STC发展

都市快报橙柿互动 浏览 365

一夜翻盘,炫富网红蓝战非复活了

TVB的四小花 浏览 1968

圣米伦夺苏格兰联赛杯,进球队员赛后采访不慎爆粗后道歉

懂球帝 浏览 1219

魏牌9年换9帅,魏建军:他们自己感觉压力大

雷达财经 浏览 1229

这些才是适合普通人的穿搭!秋天多穿蓝色单品和风衣,好耐看

静儿时尚达人 浏览 1784

九旬李明启谈到容嬷嬷为自己发声

蜜桔娱乐 浏览 1657

迈瑞医疗市值跌了三千亿,第三次上市,74岁李西廷越来越忙

懂财帝 浏览 1885

小S复出获奖细节:纹了大S名字还带了骨灰

萌神木木 浏览 1910

你有没有发现 保时捷越来越像大众了?

网易汽车 浏览 1745

4名游客遭马蜂袭击送医抢救:满头被蜇 头发都剃光了

极目新闻 浏览 8495

丝袜称明年随心参赛无视强制参赛规则,高芙称女网更有趣更具悬念

网球之家 浏览 1686

支持老东家,阿什利-扬晒自己现场观战曼联客战阿森纳照片

懂球帝 浏览 893

一线城市二手房挂牌量下降,2026年会迎来股市楼市齐涨的局面吗?

郭施亮 浏览 549
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1