AI,正在疯狂污染中文互联网
滥用AI,也毁了AI
编者按:本文来自微信公众号 量子位 (ID:QbitAI),作者:金磊 尚恩,创业邦经授权转载,头图来自摄图网
污染中文互联网,AI成了“罪魁祸首”之一。
(资料图片)
事情是这样的。
最近大家不是都热衷于向AI咨询嘛,有位网友就问了Bing这么一个问题:
象鼻山是否有缆车?
Bing也是有问必答,给出了看似挺靠谱的答案:
在给出肯定的答复之后,Bing还贴心地附带上了票价、营业时间等细节信息。
不过这位网友并没有直接采纳答案,而是顺藤摸瓜点开了下方的“参考链接”。
此时网友察觉到了一丝丝的不对劲——这人的回答怎么“机里机气”的。
于是他点开了这位叫“百变人生”的用户主页,猛然发觉,介是个AI啊!
因为这位用户回答问题速度可以说是极快,差不多每1、2分钟就能搞定一个问题。
甚至能在1分钟之内回答2个问题。
在这位网友更为细心的观察之下,发现这些回答的内容都是没经过核实的那种……
并且他认为,这就是导致Bing输出错误答案的原因:
这个AI疯狂地污染中文互联网。
“AI污染源”,不止这一个
那么被网友发现的这位AI用户,现在怎么样了?
从目前结果来看,他已经被被知乎“判处”为禁言状态。
但尽管如此,也有其他网友直言不讳地表示:
不止一个。
若是点开知乎的“等你回答”这个栏目,随机找一个问题,往下拉一拉,确实是能碰到不少“机言机语”的回答。
例如我们在“AI在生活中的应用场景有哪些?”的回答中便找到了一个:
不仅是回答的语言“机言机语”,甚至回答直接打上了“包含AI辅助创作”的标签。
然后如果我们把问题丢给ChatGPT,那么得到回答……嗯,挺换汤不换药的。
事实上,诸如此类的“AI污染源”不止是在这一个平台上有。
就连简单的科普配图这事上,AI也是屡屡犯错。
网友们看完这事也是蚌埠住了:“好家伙,没有一个配图是河蚌”。
甚至各类AI生成的假新闻也是屡见不鲜。
例如前一段时间,便有一则耸人听闻的消息在网上疯传,标题是《郑州鸡排店惊现血案,男子用砖头砸死女子!》。
但事实上,这则新闻是江西男子陈某为吸粉引流,利用ChatGPT生成的。
无独有偶,广东深圳的洪某弟也是通过AI技术,发布过《今晨,甘肃一火车撞上修路工人, 致9人死亡》假新闻。
具体而言,他在全网搜索近几年的社会热点新闻,并使用AI软件对新闻时间、地点等进行修改编辑后,在某些平台赚取关注和流量进行非法牟利。
警方均已对他们采取了刑事强制措施。
但其实这种“AI污染源”的现象不仅仅是在国内存在,在国外亦是如此。
程序员问答社区Stack Overflow便是一个例子。
早在去年年底ChatGPT刚火起来的时候,Stack Overflow便突然宣布“临时禁用”。
当时官方给出来的理由是这样的:
(这样做)的目的是减缓使用ChatGPT创建的大量答案流入社区。
因为从ChatGPT得到错误答案的概率太高了!
Stack Overflow进一步阐述了这种现象。
他们认为以前用户回答的问题,都是会有专业知识背景的其他用户浏览,并给出正确与否,相当于是核实过。
但自打ChatGPT出现之后,涌现了大量让人觉得“很对”的答案;而有专业知识背景的用户数量是有限,没法把这些生成的答案都看个遍。
加之ChatGPT回答这些个专业性问题,它的错误率是实实在在摆在那里的;因此Stack Overflow才选择了禁用。
一言蔽之,AI污染了社区环境。
而且像在美版贴吧Reddit上,也是充斥着较多的ChatGPT板块、话题:
许多用户在这种栏目之下会提出各式各样的问题,ChatGPT bot也是有问必答。
不过,还是老问题,答案的准确性如何,就不得而知了。
但这种现象背后,其实还隐藏着更大的隐患。
滥用AI,也毁了AI
AI模型获得大量互联网数据,却无法很好地辨别信息的真实性和可信度。
结果就是,我们不得不面对一大堆快速生成的低质量内容,让人眼花缭乱,头晕目眩。
很难想象ChatGPT这些大模型如果用这种数据训练,结果会是啥样……
而如此滥用AI,反过来也是一种自噬。
最近,英国和加拿大的研究人员在arXiv上发表了一篇题目为《The Curse of Recursion: Training on Generated Data Makes Models Forget》的论文。
探讨了现在AI生成内容污染互联网的现状,然后公布了一项令人担忧的发现,使用模型生成的内容训练其他模型,会导致结果模型出现不可逆的缺陷。
这种AI生成数据的“污染”会导致模型对现实的认知产生扭曲,未来通过抓取互联网数据来训练模型会变得更加困难。
论文作者,剑桥大学和爱丁堡大学安全工程教授Ross Anderson毫不避讳的直言:
正如我们用塑料垃圾布满了海洋,用二氧化碳填满了大气层,我们即将用废话填满互联网。
对于虚假信息满天飞的情况,Google Brain的高级研究科学家达芙妮 · 伊波利托(Daphne Ippolito)表示:想在未来找到高质量且未被AI训练的数据,将难上加难。
假如满屏都是这种无营养的劣质信息,如此循环往复,那以后AI就没有数据训练,输出的结果还有啥意义呢。
基于这种状况,大胆设想一下。一个成长于垃圾、虚假数据环境中的AI,在进化成人前,可能就先被拟合成一个“智障机器人”、一个心理扭曲的心理智障。
就像1996年的科幻喜剧电影《丈夫一箩筐》,影片讲述了一个普通人克隆自己,然后又克隆克隆人,每一次克隆都导致克隆人的智力水平呈指数下降,愚蠢程度增加。
那个时候,我们可能将不得不面临一个荒谬困境:人类创造了具有惊人能力的AI,而它却塞满了无聊愚蠢的信息。
如果AI被喂进的只是虚假的垃圾数据,我们又能期待它们创造出什么样的内容呢?
假如时间到那个时候,我们大概都会怀念过去,向那些真正的人类智慧致敬吧。
话虽如此,但也不全坏消息。比如部分内容平台已开始关注AI生成低劣内容的问题,并推出相关规定加以限制。
一些个AI公司也开始搞能鉴别AI生成内容的技术,以减少AI虚假、垃圾信息的爆炸。
参考链接:
[1]https://www.v2ex.com/t/948487
[2]https://twitter.com/oran_ge/status/1669160826186633219
[3]https://www.qbitai.com/2022/12/40167.html
[4]https://arxiv.org/abs/2305.17493v2
[5]https://albertoromgar.medium.com/generative-ai-could-pollute-the-internet-to-death-fb84befac250
[6]https://futurism.com/ai-generates-fake-news
本文为专栏作者授权创业邦发表,版权归原作者所有。文章系作者个人观点,不代表创业邦立场,转载请联系原作者。如有任何疑问,请联系editor@cyzone.cn。
标签:
壮汉融合的文化遗产——陈氏滴水观音艾灸保健疗法
2022-06-20
夏季吃什么水果养阴生津?葡萄是个不错的选择
2022-06-20
凉茶≠凉的茶 喝凉了的凉茶真的健康吗?凉茶为什么不能凉着喝
2022-06-20
国家统计局:5月份一线城市二手住宅销售价格环比下降0.4%
2022-06-20
金科服务:拟收购佳源服务73.56%股权框架协议终止
2022-06-20
金茂物管4.5亿元收购首置物业服务公司100%股权
2022-06-20
旭辉控股回应大裁员:正考虑对造谣者采取必要措施
2022-06-20
山东深耕文化资源 推动旅游业高质量发展
2021-12-02
四川非遗传承人张雄志:巧手捏面塑 指尖传非遗
2021-12-02
10月以来我国寒潮为何如此频繁?中国气象局回应
2021-12-02
夏季吃什么水果养阴生津?葡萄是个不错的选择
凉茶≠凉的茶 喝凉了的凉茶真的健康吗?凉茶为什么不能凉着喝
国家统计局:5月份一线城市二手住宅销售价格环比下降0.4%
金科服务:拟收购佳源服务73.56%股权框架协议终止
金茂物管4.5亿元收购首置物业服务公司100%股权
旭辉控股回应大裁员:正考虑对造谣者采取必要措施
哈尔滨新增本土确诊病例3例 活动轨迹公布
哈尔滨市公布3例新增本土新冠肺炎确诊病例活动轨迹
山东深耕文化资源 推动旅游业高质量发展
今年新增952件(套)!南京大屠杀再添新证
四川非遗传承人张雄志:巧手捏面塑 指尖传非遗
10月以来我国寒潮为何如此频繁?中国气象局回应
56位残疾人士登上黄山 互利互勉共建生活希望
安徽潜山两车相撞 已致8人死亡3人受伤
上海洋山海关首次在出口货运渠道查获夹带卷烟
山西忻州古城:一城风华延续千年历史文脉
呼伦贝尔新巴尔虎右旗公布1例无症状感染者行动轨迹
西藏林芝:多彩民俗活动迎接工布新年
面对儿童不得不防的“杀手”,这把椅子很重要!
新增“53+1” 内蒙古累计本土确诊病例增至185例
昆明公安打击破坏生物多样性犯罪 抓获130名涉案嫌疑人
山西朔州“11·11”较大透水事故调查报告发布 对38人问责处理
“海关国门小卫士”竞争上岗 淘汰率接近一半
深圳摧毁特大品牌化妆品走私网
28人被问责!山西石港煤业“3·25”事故调查报告公布
湖南韶山以河长制带动全民治水 让每一处水面“长治久清”
民进会员谈反映社情民意信息工作:心怀大我 敢讲实情
80岁“留守”奶奶短视频诉孤独 千万网友心疼:我们陪您唠嗑
40年来为子弟兵送出1.3万余双布鞋和鞋垫的“布鞋奶奶”走了
- 当男幼师是什么体验?他们说:有委屈尴尬 但大部分是幸福
- 庐阳警方通报幼童坠亡事件:嫌疑人已被刑拘
- 内蒙古新增本土确诊病例53例、本土无症状感染者1例
- 哈尔滨市启动部分地区第一轮全员核酸检测
- 四川通江发生两车相撞事故 致3人死亡
- 11月谣言在“身边”,别信这些无稽之谈
- 追剧为何上瘾?你追的不是剧,而是及时满足的快感
- 对症下药“十年痼疾”,“茶博士”帮老茶园重焕生机
- 不会融化的“果冻冰块”研制成功 有望改变食物冷藏方式
- “逆行”考研=集体滑落?这结论该慎下
- 老鼠油治烫伤致孩子进ICU 害人偏方为何被奉为灵丹妙药
- 老人被野猪咬伤 打猎者赔了5万多
- 既促进生产又保护生态他用古代农耕智慧造福现代农业
- “布鞋奶奶”走了 曾亲自给部队子弟兵送鞋40年
- 试行“家长学校”“持证上岗”?可以引导但不宜“法外加槛”
- 成为“南京胖哥”后的日子:见义勇为被捅伤 他说不后悔
- “法不责众”不是健走团“占道”的护身符
- 北京五道口增设行人信号灯四面全绿时段
- 北京道路停车支持ETC无感支付
- 北京多措并举提高生物多样性 今冬将迎300万只候鸟
- 北京:建议研考考生考前14天在京备考
- 将“干部”当店名 这个口子不能开
- 北京市2022年民生实事邀市民投票
- 吸氢气就能抗癌又防衰?最新“科学”流言榜发布
- 北京:242辆京牌小客车参加司法处置
- 云南磨憨边检站中老边境缴毒逾4公斤
- 故宫博物院2022年年票紧急停售 恢复销售时间将另行公告
- 世界艾滋病日:关于艾滋病,我想和你聊聊
- 北京:保障在校体育锻炼1小时获较高认可
- 满洲里高风险地区增至6个 中国内地新冠疫苗接种超25亿剂次
- 内蒙古满洲里公布55例本土确诊病例行动轨迹
- 四川绵竹首次拍摄到野生大熊猫标记行为 划定领地或吸引异性
- 广州长隆举办“猿猴特展” 稀有“夜猴”首秀
- 满洲里对公路、铁路口岸所有环节和场地加强闭环管理
- 安徽合肥警方严打食药环知森领域违法犯罪 侦破重特大案件14起
- 北京海关今年已查获2700余批次涉嫌侵权商品
- 福建福州海警局利用无人机成功查获一起非法采矿案
- 陕西83所高校辅导员“比技能、拼实力” “以赛促学”提升专业素质
- 西安警方侦破特大制毒贩毒案 缴获成品半成品疑似毒品10余公斤
- 全球首次荒漠猫卫星颈圈跟踪研究取得新进展
- 内蒙古满洲里公布55名确诊病例详情:有26名学生
- 中国唯一艾滋病患儿学校成立十周年
- 昆明境外既往感染复阳病例关联人员两轮核酸检测均为阴性
- 重庆:非法捕捞工具集中销毁 营造良好禁捕氛围
- 中演协发声明辟谣网络不实言论 将依法维护权益
- 浙江:中老年群体艾滋病感染者占比有增加趋势
- 宁夏:保障三孩生育政策配套支持措施
- 青海茫崖森警大队救助濒危野生动物黑鸢
- 西宁市发放公交“蓝焰卡” 消防指战员可免费乘车
- 河北衡水中级以上职称医师下沉乡镇卫生院 实现优质人才全覆盖