南方日?qǐng)?bào) 2025-08-08 16:17:40
國(guó)家安全部近日發(fā)文提示,人工智能的訓(xùn)練數(shù)據(jù)存在良莠不齊的問(wèn)題,其中不乏虛假信息、虛構(gòu)內(nèi)容和偏見(jiàn)性觀點(diǎn),造成數(shù)據(jù)源污染,給人工智能安全帶來(lái)新的挑戰(zhàn)。
“數(shù)據(jù)污染”在網(wǎng)絡(luò)上泛濫,“數(shù)據(jù)投毒”沖擊安全防線,我們?cè)撊绾畏婪叮?/p>
網(wǎng)絡(luò)配圖
(一)
數(shù)據(jù)有多重要?
人們常說(shuō)“人是鐵,飯是鋼”,對(duì)于AI大模型而言,大量的數(shù)據(jù)集就像是它的“一日三餐”,而高質(zhì)量、清晰標(biāo)注的數(shù)據(jù)無(wú)疑是最美味的:各種“營(yíng)養(yǎng)素”一應(yīng)俱全,“制作過(guò)程”干凈衛(wèi)生,每種“食材”的源頭都可追溯。
所謂“數(shù)據(jù)投毒”,是通過(guò)向AI大模型訓(xùn)練數(shù)據(jù)中注入偽裝成正常樣本的惡意數(shù)據(jù),實(shí)現(xiàn)削弱模型性能、降低準(zhǔn)確性的攻擊方法,常用于惡性市場(chǎng)競(jìng)爭(zhēng),甚至涉及國(guó)與國(guó)之間的間諜活動(dòng)。這確實(shí)很像是在“投毒”,且往往是一種“慢性毒藥”,短期會(huì)出現(xiàn)結(jié)論偏差報(bào)錯(cuò),像是“吃壞了肚子”,若輕視其破壞力,還會(huì)帶來(lái)現(xiàn)實(shí)風(fēng)險(xiǎn)。
在金融投資領(lǐng)域,一個(gè)小數(shù)點(diǎn)的誤差,就可能引發(fā)股價(jià)異常波動(dòng)、億萬(wàn)資金損失;在醫(yī)療衛(wèi)生領(lǐng)域,AI開(kāi)方越來(lái)越流行,若是有人從中使壞,這“毒”可就是真毒了;在智能駕駛領(lǐng)域,若在訓(xùn)練環(huán)節(jié)就埋下隱患,或在行駛時(shí)輸入干擾指令,后果不堪設(shè)想……
“蝴蝶效應(yīng)”在“數(shù)據(jù)投毒”中同樣存在,表現(xiàn)為“遞歸污染”或是“污染遺留效應(yīng)”。如今的互聯(lián)網(wǎng),AI生成內(nèi)容在數(shù)量上已遠(yuǎn)超人類(lèi)生產(chǎn)的真實(shí)內(nèi)容,大量低質(zhì)量及非客觀數(shù)據(jù)充斥其中,若不加約束,可能導(dǎo)致將錯(cuò)就錯(cuò),進(jìn)一步侵蝕知識(shí)大廈的根基。
(二)
談到“數(shù)據(jù)投毒”,不可避免會(huì)與當(dāng)下熱議的“數(shù)據(jù)污染”“AI幻覺(jué)”等現(xiàn)象聯(lián)系在一起。一旦數(shù)據(jù)污染,“流毒”入腦,自然會(huì)誤導(dǎo)判斷,產(chǎn)生“幻覺(jué)”。
現(xiàn)實(shí)生活中,常聽(tīng)到一種抱怨:互聯(lián)網(wǎng)上的“流毒”似乎越來(lái)越多了,數(shù)據(jù)和文章的質(zhì)量越來(lái)越差了。這難道都是因?yàn)橥獠康摹吧衩亓α俊痹丛床粩嗟亍皵?shù)據(jù)投毒”嗎?
恐怕不全是,因?yàn)樵S多低質(zhì)量的數(shù)據(jù)、極端的言論、錯(cuò)誤的觀點(diǎn),本就是由平臺(tái)和用戶(hù)共同生產(chǎn)出來(lái)的,它們?cè)诰W(wǎng)絡(luò)空間中層層累積,在現(xiàn)實(shí)社會(huì)中侵蝕理性,久而久之誤導(dǎo)輿論,“代謝”起來(lái)更是格外困難。
比如,不合理的推送機(jī)制營(yíng)造出越來(lái)越多的“信息繭房”,縱容極端發(fā)言在其中“養(yǎng)蠱”,群體對(duì)立進(jìn)一步激化,不實(shí)內(nèi)容未經(jīng)證實(shí)便全網(wǎng)推送。
你能想象,這些充斥著戾氣與偏見(jiàn)的文字被AI大模型反復(fù)抓取,又再次生成內(nèi)容和觀點(diǎn)的后果嗎?之前微博評(píng)論區(qū)失控的“評(píng)論羅伯特”(生成式AI機(jī)器人賬號(hào))就是明證——或是陰陽(yáng)怪氣,或是胡言亂語(yǔ),或是互噴互罵,著實(shí)讓人捏了一把冷汗。
又比如,虛假文本被交叉引用,使得AI的“幻覺(jué)”越來(lái)越嚴(yán)重。部分賬號(hào)將“包含AI生成內(nèi)容,請(qǐng)謹(jǐn)慎甄別”等提醒作為擋箭牌,似乎這樣就可免于對(duì)內(nèi)容質(zhì)量負(fù)責(zé),讀者舉報(bào)糾錯(cuò)往往石沉大海。低質(zhì)量的生成內(nèi)容充斥網(wǎng)絡(luò)又缺乏監(jiān)管,可能導(dǎo)向惡性循環(huán)。
再比如,每有突發(fā)事件發(fā)生,經(jīng)常伴有大量AI謠言,有的偷換時(shí)間、地點(diǎn)、人物等要素,就能產(chǎn)出成百上千條;有的謠言雖然只是改動(dòng)個(gè)別數(shù)據(jù)、拼接虛假圖片,卻足以讓AI檢索失靈。
從這個(gè)角度看,便不難理解為何最近國(guó)家網(wǎng)信辦聯(lián)合各家媒體機(jī)構(gòu),加大辟謠力度,提升辟謠精度,增強(qiáng)信息發(fā)布的時(shí)效性。其中一個(gè)目標(biāo),就是要將不斷進(jìn)化的“流毒”扼殺在源頭,避免AI越來(lái)越“笨”、越來(lái)越極端。
(三)
數(shù)據(jù)污染并非一天產(chǎn)生,更不是AI出現(xiàn)后才冒頭的。
曾引起輿論沸騰的魏則西事件,揭開(kāi)了搜索引擎廣告競(jìng)價(jià)排名的陰暗面。然而近十年過(guò)去了,部分虛假?gòu)V告、高仿網(wǎng)頁(yè)仍在打擦邊球,用戶(hù)仍在提心吊膽。
在社交媒體、商業(yè)平臺(tái)上,自媒體的內(nèi)容得到重點(diǎn)呈現(xiàn),其中“標(biāo)題黨”長(zhǎng)期橫行,獵奇炒作成為“主流”,而主流媒體的內(nèi)容反而變得不受歡迎,常常被隱于角落。
以周口婦產(chǎn)科醫(yī)生因網(wǎng)暴墜樓一事為例,本該用客觀事實(shí)和法律裁決說(shuō)事,卻僅憑三個(gè)自媒體賬號(hào)的互相轉(zhuǎn)發(fā)、粉絲群體的無(wú)端謾罵,就污蔑一位盡職盡責(zé)的醫(yī)生,誤導(dǎo)網(wǎng)友的判斷。若自媒體依舊沒(méi)有邊界,平臺(tái)監(jiān)管依然無(wú)力,類(lèi)似悲劇可能還會(huì)發(fā)生。
上述例子并無(wú)AI的參與,更談不上是“投毒”,而是我們的信息生產(chǎn)和曝光的機(jī)制出現(xiàn)了問(wèn)題,給了自媒體耀武揚(yáng)威、裹挾網(wǎng)民的空間。AI檢索、數(shù)據(jù)抓取、模型訓(xùn)練則發(fā)揮了“加速器”的作用,將部分低質(zhì)量甚至不實(shí)的內(nèi)容廣為傳播和應(yīng)用。
如今許多人使用搜索引擎時(shí),傾向于點(diǎn)擊“資訊”分類(lèi)而非默認(rèn)的“網(wǎng)頁(yè)”欄,只是不想看到眾說(shuō)紛紜卻又真假難辨的自媒體文章;許多運(yùn)營(yíng)者也習(xí)慣了用爭(zhēng)議話題、掛各種tag(標(biāo)簽)來(lái)“起號(hào)”“養(yǎng)號(hào)”,正是在利用平臺(tái)的曝光機(jī)制彌補(bǔ)內(nèi)容上的硬傷。當(dāng)你拿著這些去問(wèn)DeepSeek,它都會(huì)忍不住提醒你“反復(fù)核查真實(shí)性”。
凈化數(shù)據(jù)不僅要警惕外部“投毒”,更要不斷在內(nèi)部“清污”。唯有標(biāo)本兼治,對(duì)癥下藥,方能練就AI時(shí)代的“信息免疫力”。
責(zé)編:施泉江
一審:施泉江
二審:李茁
三審:唐婷
來(lái)源:南方日?qǐng)?bào)
我要問(wèn)