中文精品欧美无线码一区,日韩黄a,99热a

警惕人工智能遭“數(shù)據(jù)投毒”

南方日?qǐng)?bào) 2025-08-08 16:17:40

國(guó)家安全部近日發(fā)文提示，人工智能的訓(xùn)練數(shù)據(jù)存在良莠不齊的問(wèn)題，其中不乏虛假信息、虛構(gòu)內(nèi)容和偏見(jiàn)性觀點(diǎn)，造成數(shù)據(jù)源污染，給人工智能安全帶來(lái)新的挑戰(zhàn)。

“數(shù)據(jù)污染”在網(wǎng)絡(luò)上泛濫，“數(shù)據(jù)投毒”沖擊安全防線，我們?cè)撊绾畏婪叮?/p>

網(wǎng)絡(luò)配圖

（一）

數(shù)據(jù)有多重要？

人們常說(shuō)“人是鐵，飯是鋼”，對(duì)于AI大模型而言，大量的數(shù)據(jù)集就像是它的“一日三餐”，而高質(zhì)量、清晰標(biāo)注的數(shù)據(jù)無(wú)疑是最美味的：各種“營(yíng)養(yǎng)素”一應(yīng)俱全，“制作過(guò)程”干凈衛(wèi)生，每種“食材”的源頭都可追溯。

所謂“數(shù)據(jù)投毒”，是通過(guò)向AI大模型訓(xùn)練數(shù)據(jù)中注入偽裝成正常樣本的惡意數(shù)據(jù)，實(shí)現(xiàn)削弱模型性能、降低準(zhǔn)確性的攻擊方法，常用于惡性市場(chǎng)競(jìng)爭(zhēng)，甚至涉及國(guó)與國(guó)之間的間諜活動(dòng)。這確實(shí)很像是在“投毒”，且往往是一種“慢性毒藥”，短期會(huì)出現(xiàn)結(jié)論偏差報(bào)錯(cuò)，像是“吃壞了肚子”，若輕視其破壞力，還會(huì)帶來(lái)現(xiàn)實(shí)風(fēng)險(xiǎn)。

在金融投資領(lǐng)域，一個(gè)小數(shù)點(diǎn)的誤差，就可能引發(fā)股價(jià)異常波動(dòng)、億萬(wàn)資金損失；在醫(yī)療衛(wèi)生領(lǐng)域，AI開(kāi)方越來(lái)越流行，若是有人從中使壞，這“毒”可就是真毒了；在智能駕駛領(lǐng)域，若在訓(xùn)練環(huán)節(jié)就埋下隱患，或在行駛時(shí)輸入干擾指令，后果不堪設(shè)想……

“蝴蝶效應(yīng)”在“數(shù)據(jù)投毒”中同樣存在，表現(xiàn)為“遞歸污染”或是“污染遺留效應(yīng)”。如今的互聯(lián)網(wǎng)，AI生成內(nèi)容在數(shù)量上已遠(yuǎn)超人類(lèi)生產(chǎn)的真實(shí)內(nèi)容，大量低質(zhì)量及非客觀數(shù)據(jù)充斥其中，若不加約束，可能導(dǎo)致將錯(cuò)就錯(cuò)，進(jìn)一步侵蝕知識(shí)大廈的根基。

（二）

談到“數(shù)據(jù)投毒”，不可避免會(huì)與當(dāng)下熱議的“數(shù)據(jù)污染”“AI幻覺(jué)”等現(xiàn)象聯(lián)系在一起。一旦數(shù)據(jù)污染，“流毒”入腦，自然會(huì)誤導(dǎo)判斷，產(chǎn)生“幻覺(jué)”。

現(xiàn)實(shí)生活中，常聽(tīng)到一種抱怨：互聯(lián)網(wǎng)上的“流毒”似乎越來(lái)越多了，數(shù)據(jù)和文章的質(zhì)量越來(lái)越差了。這難道都是因?yàn)橥獠康摹吧衩亓α俊痹丛床粩嗟亍皵?shù)據(jù)投毒”嗎？

恐怕不全是，因?yàn)樵S多低質(zhì)量的數(shù)據(jù)、極端的言論、錯(cuò)誤的觀點(diǎn)，本就是由平臺(tái)和用戶(hù)共同生產(chǎn)出來(lái)的，它們?cè)诰W(wǎng)絡(luò)空間中層層累積，在現(xiàn)實(shí)社會(huì)中侵蝕理性，久而久之誤導(dǎo)輿論，“代謝”起來(lái)更是格外困難。

比如，不合理的推送機(jī)制營(yíng)造出越來(lái)越多的“信息繭房”，縱容極端發(fā)言在其中“養(yǎng)蠱”，群體對(duì)立進(jìn)一步激化，不實(shí)內(nèi)容未經(jīng)證實(shí)便全網(wǎng)推送。

你能想象，這些充斥著戾氣與偏見(jiàn)的文字被AI大模型反復(fù)抓取，又再次生成內(nèi)容和觀點(diǎn)的后果嗎？之前微博評(píng)論區(qū)失控的“評(píng)論羅伯特”（生成式AI機(jī)器人賬號(hào)）就是明證——或是陰陽(yáng)怪氣，或是胡言亂語(yǔ)，或是互噴互罵，著實(shí)讓人捏了一把冷汗。

又比如，虛假文本被交叉引用，使得AI的“幻覺(jué)”越來(lái)越嚴(yán)重。部分賬號(hào)將“包含AI生成內(nèi)容，請(qǐng)謹(jǐn)慎甄別”等提醒作為擋箭牌，似乎這樣就可免于對(duì)內(nèi)容質(zhì)量負(fù)責(zé)，讀者舉報(bào)糾錯(cuò)往往石沉大海。低質(zhì)量的生成內(nèi)容充斥網(wǎng)絡(luò)又缺乏監(jiān)管，可能導(dǎo)向惡性循環(huán)。

再比如，每有突發(fā)事件發(fā)生，經(jīng)常伴有大量AI謠言，有的偷換時(shí)間、地點(diǎn)、人物等要素，就能產(chǎn)出成百上千條；有的謠言雖然只是改動(dòng)個(gè)別數(shù)據(jù)、拼接虛假圖片，卻足以讓AI檢索失靈。

從這個(gè)角度看，便不難理解為何最近國(guó)家網(wǎng)信辦聯(lián)合各家媒體機(jī)構(gòu)，加大辟謠力度，提升辟謠精度，增強(qiáng)信息發(fā)布的時(shí)效性。其中一個(gè)目標(biāo)，就是要將不斷進(jìn)化的“流毒”扼殺在源頭，避免AI越來(lái)越“笨”、越來(lái)越極端。

（三）

數(shù)據(jù)污染并非一天產(chǎn)生，更不是AI出現(xiàn)后才冒頭的。

曾引起輿論沸騰的魏則西事件，揭開(kāi)了搜索引擎廣告競(jìng)價(jià)排名的陰暗面。然而近十年過(guò)去了，部分虛假?gòu)V告、高仿網(wǎng)頁(yè)仍在打擦邊球，用戶(hù)仍在提心吊膽。

在社交媒體、商業(yè)平臺(tái)上，自媒體的內(nèi)容得到重點(diǎn)呈現(xiàn)，其中“標(biāo)題黨”長(zhǎng)期橫行，獵奇炒作成為“主流”，而主流媒體的內(nèi)容反而變得不受歡迎，常常被隱于角落。

以周口婦產(chǎn)科醫(yī)生因網(wǎng)暴墜樓一事為例，本該用客觀事實(shí)和法律裁決說(shuō)事，卻僅憑三個(gè)自媒體賬號(hào)的互相轉(zhuǎn)發(fā)、粉絲群體的無(wú)端謾罵，就污蔑一位盡職盡責(zé)的醫(yī)生，誤導(dǎo)網(wǎng)友的判斷。若自媒體依舊沒(méi)有邊界，平臺(tái)監(jiān)管依然無(wú)力，類(lèi)似悲劇可能還會(huì)發(fā)生。

上述例子并無(wú)AI的參與，更談不上是“投毒”，而是我們的信息生產(chǎn)和曝光的機(jī)制出現(xiàn)了問(wèn)題，給了自媒體耀武揚(yáng)威、裹挾網(wǎng)民的空間。AI檢索、數(shù)據(jù)抓取、模型訓(xùn)練則發(fā)揮了“加速器”的作用，將部分低質(zhì)量甚至不實(shí)的內(nèi)容廣為傳播和應(yīng)用。

如今許多人使用搜索引擎時(shí)，傾向于點(diǎn)擊“資訊”分類(lèi)而非默認(rèn)的“網(wǎng)頁(yè)”欄，只是不想看到眾說(shuō)紛紜卻又真假難辨的自媒體文章；許多運(yùn)營(yíng)者也習(xí)慣了用爭(zhēng)議話題、掛各種tag（標(biāo)簽）來(lái)“起號(hào)”“養(yǎng)號(hào)”，正是在利用平臺(tái)的曝光機(jī)制彌補(bǔ)內(nèi)容上的硬傷。當(dāng)你拿著這些去問(wèn)DeepSeek，它都會(huì)忍不住提醒你“反復(fù)核查真實(shí)性”。

凈化數(shù)據(jù)不僅要警惕外部“投毒”，更要不斷在內(nèi)部“清污”。唯有標(biāo)本兼治，對(duì)癥下藥，方能練就AI時(shí)代的“信息免疫力”。

責(zé)編：施泉江

一審：施泉江

二審：李茁

三審：唐婷

來(lái)源：南方日?qǐng)?bào)

我要問(wèn)

日本www黄,欧美日韩成人在线观看,欧美专区在线观看,中文字幕+乱码+中文乱,99热少妇,伊人久久成人,久久伊人超碰