華裔00后戳破頂會(huì)泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

華裔00后戳破頂會(huì)泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

新智元報(bào)道

編輯論文:元宇

【新智元導(dǎo)讀】用AI檢測(cè)AI幻覺,用魔法打敗魔法!剛剛,NeurIPS已收錄論文被曝出數(shù)百條AI幻覺引用,至少53篇論文中招論文。為了對(duì)抗AI幻覺、造假所帶來的學(xué)術(shù)「污染」,首先拿起AI武器的,也應(yīng)當(dāng)是AI頂會(huì)。

數(shù)百項(xiàng)虛假引用論文,53篇頂會(huì)論文被抓包!

剛剛,NeurIPS頂會(huì)暴雷,全球AI圈的「奧斯卡」盛會(huì),被一家華人00后的AI初創(chuàng)公司「打假」了論文。

這家名為GPTZero的公司在掃描了NeurIPS 2025年所接收的4841篇論文后,發(fā)現(xiàn)了數(shù)百條由AI「編造」出來的引用,至少53篇論文「證據(jù)確鑿」論文。

GPTZero CEO Edward Tian將其稱作一個(gè)重要的節(jié)點(diǎn)時(shí)刻論文

這是首次有記錄顯示,幻覺引用進(jìn)入了頂級(jí)機(jī)器學(xué)習(xí)會(huì)議的官方文獻(xiàn)論文。

華裔00后戳破頂會(huì)泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

展開全文

GPTZero聯(lián)合創(chuàng)始人兼CEO Edward Tian(左)與聯(lián)合創(chuàng)始人兼CTO Alex Cui(右)論文。

當(dāng)「John Smith」這種占位符名字(類似中國的張三、李四),堂而皇之地出現(xiàn)在頂會(huì)參考文獻(xiàn)中,這意味著學(xué)術(shù)研究的基石已經(jīng)被AI幻覺「侵蝕」了論文

更離譜的是,在GPTZero展示的例子中,圖靈獎(jiǎng)得主Yann LeCun的名字,以「Samuel LeCun Jackson」的虛構(gòu)引用形式,出現(xiàn)在了另一篇有關(guān)深度學(xué)習(xí)的論文中論文

華裔00后戳破頂會(huì)泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

學(xué)術(shù)引用的嚴(yán)謹(jǐn)性對(duì)于科研的意義不言而喻論文。

當(dāng)謊言被引用了一千次,它在數(shù)據(jù)集中就變成了真理論文。

如果不加干預(yù),未來的研究者在引用這些「經(jīng)典」時(shí),就像是在虛無縹緲的云端建造空中樓閣論文。

以前科學(xué)家們的研究是站在了巨人的肩膀上,今后很可能是站在AI的幻覺之上了論文。

華裔00后戳破頂會(huì)泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

53篇論文驚現(xiàn)AI幻覺引用

頂會(huì)濾鏡破碎

在AI學(xué)術(shù)圈,NeurIPS長期以來被視為一座「圣殿」論文

在這里發(fā)表論文,幾乎等同于拿到了進(jìn)入Google DeepMind或OpenAI等頂級(jí)實(shí)驗(yàn)室的入場券論文。

然而,這層看上去高大上的「神圣濾鏡」,卻被GPTZero擊碎了論文。

他們對(duì)NeurIPS 2025已正式發(fā)表的4841篇論文進(jìn)行了一次「地毯式掃描」論文,結(jié)果猶如一記重磅炸彈:

至少53篇論文,被檢測(cè)出包含數(shù)百條由大模型憑空捏造的引用論文。

最令人震驚的是,這些連鏈接都可能指向404的低級(jí)錯(cuò)誤,竟悉數(shù)「騙」過了每篇論文至少三名專家的同行評(píng)審防線論文。

華裔00后戳破頂會(huì)泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

NeurIPS 2025現(xiàn)場

頂會(huì)的尊嚴(yán),在AI幻覺面前,顯得不堪一擊論文。

華裔00后戳破頂會(huì)泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

如上圖,在GPTZero的官方博客中,公布了53篇NeurIPS論文中發(fā)表的100條虛構(gòu)引用列表論文。

在上圖所顯示的這篇論文中,GPTZero檢測(cè)到存在一篇標(biāo)題相同的文章,作者顯然是偽造的論文。

華裔00后戳破頂會(huì)泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

在上面這篇關(guān)于深度學(xué)習(xí)技術(shù)的論文中,顯示無作者或標(biāo)題匹配,說明該文章不存在于出版物中,其URL和DOI均為偽造論文。

GPTZero曾嘗試通過多種名稱來描述AI生成的幻覺引用論文。

「幻覺引用」(hallucinated citations)太長,「虛假引用」(fake citations)則帶有過強(qiáng)的道德評(píng)判色彩論文。

華裔00后戳破頂會(huì)泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

Alex Adams

最終,GPTZero機(jī)器學(xué)習(xí)主管Alex Adams提出了「氛圍引用」(vibe citing)一詞,用來描述大模型將真實(shí)來源進(jìn)行推導(dǎo)或拼湊,從而生成看似逼真卻是虛假信息的傾向論文

「氛圍引用」與「氛圍寫作」(vibe writing)或「氛圍編碼」(vibe coding)類似,其生成的引用乍看之下似乎準(zhǔn)確無誤,但經(jīng)不起仔細(xì)推敲論文

華裔00后戳破頂會(huì)泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

利用AI撰寫研究論文迅速流行,體現(xiàn)了「氛圍引用」(vibe-citing)的快速增長

從上圖中可以看出,2025年4月和9月的峰值分別對(duì)應(yīng)NeurIPS和ICLR 2025的論文提交截止日期論文。

華裔00后戳破頂會(huì)泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

AI幻覺的進(jìn)化

Edward Tian認(rèn)為,NeurIPS的情況更令人擔(dān)憂,因?yàn)閱栴}出現(xiàn)在已經(jīng)被正式接收并發(fā)表的論文中論文。

根據(jù)傳統(tǒng)的學(xué)術(shù)規(guī)范,即便只有一條偽造引用,也足以構(gòu)成拒稿理由論文。

NeurIPS 2025主賽道論文的接收率為24.52%,這意味著這些存在幻覺引用的論文擊敗了約15000篇競爭對(duì)手論文。

這些「AI幻覺」造成的引用問題,通過了同行評(píng)審,并被收錄進(jìn)最終的會(huì)議論文集論文

因此,Edward Tian認(rèn)為這次問題,相比以往是一次明顯的升級(jí),也是首次有記錄顯示幻覺引用進(jìn)入了頂級(jí)機(jī)器學(xué)習(xí)會(huì)議的官方文獻(xiàn)論文

在GPTZero曝光的部分案例中,我們看到了AI幻覺的驚人進(jìn)化論文

最初級(jí)錯(cuò)誤

最初級(jí)錯(cuò)誤,是論文參考文獻(xiàn)中出現(xiàn)了「John Smith」和「Jane Doe」這樣的占位姓名,甚至還有引用鏈接直接指向404空頁面論文。

而且,這種初級(jí)錯(cuò)誤竟然逃過了世界頂級(jí)專家的法眼論文。

「半真半假」的隱蔽偽造

這是一種更危險(xiǎn)、更深度,也更隱蔽的一種偽造論文。

AI可能會(huì)把多篇真實(shí)論文的內(nèi)容拼接或改寫,生成看起來十分可信的標(biāo)題和作者列表論文。

它還會(huì)把一篇題為「深度學(xué)習(xí)的優(yōu)化」的論文,改寫成「深度學(xué)習(xí)中的優(yōu)化策略」論文。

乍看上去作者和關(guān)鍵詞都對(duì),格式也是BibTeX的標(biāo)準(zhǔn)格式論文。

審稿人在快速瀏覽時(shí),大腦會(huì)自動(dòng)補(bǔ)全這些信息,覺得這篇文獻(xiàn)很眼熟,于是就通過了論文。

GPTZero之所以能發(fā)現(xiàn)「AI幻覺」,是因?yàn)樗慕Y(jié)果是基于事實(shí)的對(duì)照論文。

據(jù)Alex Cui介紹,GPTZero的幻覺檢測(cè)工具會(huì)讀取論文全文,通過搜索開放網(wǎng)絡(luò)和學(xué)術(shù)數(shù)據(jù)庫,逐條核實(shí)引用的作者、標(biāo)題、發(fā)表渠道和鏈接論文。

如果一條引用在現(xiàn)實(shí)世界找不到對(duì)應(yīng),或者只與真實(shí)論文部分匹配,系統(tǒng)就會(huì)拉響警報(bào)論文。

失守的防線

「投稿海嘯」與審稿過載困境

如此低級(jí)的錯(cuò)誤論文,為什么會(huì)繞過層層把關(guān)的審稿系統(tǒng)?

答案很現(xiàn)實(shí):由于內(nèi)卷,學(xué)術(shù)界的「算力」已經(jīng)跟不上了論文。

ICLR、NeurIPS、ICML和AAAI這些全球AI頂會(huì),每年吸引數(shù)千篇投稿和大量參與者論文。

由于AI、論文工廠以及發(fā)表壓力所引發(fā)的「投稿海嘯」,已使所有這些會(huì)議的審稿流程不堪重負(fù),瀕臨崩潰論文。

比如,2020年至2025年間,NeurIPS的投稿量從9467篇激增超過220%,達(dá)到21575篇,遠(yuǎn)高于2024年的15671篇和2023年的12343篇論文。

即便會(huì)議組織者動(dòng)員了成千上萬名志愿評(píng)審,但對(duì)于每篇論文及其參考文獻(xiàn)進(jìn)行深入審查也變得越來越難論文。

這就為AI幻覺的出現(xiàn)留下了可乘之機(jī)論文。

對(duì)此論文,NeurIPS理事會(huì)的官方回應(yīng)顯然有些蒼白:

1.1%的論文因使用大模型而包含一個(gè)或多個(gè)錯(cuò)誤引用,也并不意味著論文內(nèi)容本身一定無效論文。例如,作者可能只是向大模型提供了不完整的引用信息,并讓模型生成BibTeX(格式化參考文獻(xiàn))。

但是,這種說法在學(xué)術(shù)態(tài)度上也無法站住腳論文。

如果一位作者連自己的參考文獻(xiàn)都懶得核實(shí)論文,直接甩給AI去生成,且不進(jìn)行復(fù)查,我們又怎能相信他在復(fù)雜的實(shí)驗(yàn)數(shù)據(jù)上保持了嚴(yán)謹(jǐn)?

華裔00后戳破頂會(huì)泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

就像Hacker News中一位網(wǎng)友說的那樣,看到這些被標(biāo)注錯(cuò)誤的論文,會(huì)讓自己停下來思考:這篇論文的其它部分有多少是借助了AI輔助完成的論文。

「如果這些是僅有的錯(cuò)誤,我們并不擔(dān)憂,但無法確定這些就已經(jīng)是全部的錯(cuò)誤論文。這些錯(cuò)誤表明該論文在提交時(shí)未經(jīng)過徹底的幻覺檢查,作者在使用AI時(shí)也缺乏應(yīng)有的謹(jǐn)慎。」

華裔00后戳破頂會(huì)泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

用魔法打敗魔法

NeurIPS「翻車」不止是「氛圍引用」那么簡單,它動(dòng)搖的是科研誠信的基石論文。

科研就像一場接力賽論文。以AI研究為例,它高度依賴「可復(fù)現(xiàn)性」和「溯源」。

就像Edward Tian所說的:「AI研究結(jié)果向來難以復(fù)現(xiàn),因此引用至關(guān)重要論文。」

真實(shí)準(zhǔn)確的引用,能幫助研究者判斷某個(gè)結(jié)果是否可復(fù)現(xiàn),并讓他人追溯到具體、可驗(yàn)證的來源進(jìn)行測(cè)試論文。

因此論文,如果「氛圍引用」的現(xiàn)象不加以遏制,我們將面臨一種可怕的「近親繁殖」效應(yīng):

AI生成了包含幻覺的論文,這些論文被收錄進(jìn)數(shù)據(jù)庫,下一代AI模型又拿這些數(shù)據(jù)進(jìn)行訓(xùn)練論文

最終,AI開始從自己的幻覺中學(xué)習(xí)知識(shí),導(dǎo)致模型的崩塌論文

GPTZero的曝光旨在警示行業(yè)漏洞:舊有的「評(píng)審體系」,已難以應(yīng)對(duì)投稿量激增和AI使用所帶來的問題論文

如何捍衛(wèi)同行評(píng)審的尊嚴(yán)論文?

另一大頂會(huì)ICLR(國際表征學(xué)習(xí)大會(huì))已經(jīng)覺醒并開始行動(dòng)論文

ICLR將于今年4月舉辦,吸取了NeurIPS的教訓(xùn)后,它迅速聯(lián)手GPTZero,已啟動(dòng)了嚴(yán)格的「排雷」行動(dòng)論文。

此前,在GPTZero針對(duì)ICLR的一項(xiàng)投稿調(diào)研中,已經(jīng)發(fā)現(xiàn)了50條成功躲過評(píng)審的虛假引用論文。

去年11月,ICLR還發(fā)布了關(guān)于大模型生成論文及評(píng)審的應(yīng)對(duì)策略論文。

華裔00后戳破頂會(huì)泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

ICLR發(fā)出的信號(hào)非常明確:不封殺AI,但必須透明論文

幻覺引用被定性為違反「道德準(zhǔn)則」(Code of Ethics),一旦發(fā)現(xiàn)大量使用AI未披露或存在虛假內(nèi)容,將直接拒稿/桌拒(Desk Reject)論文。

更狠的是,審稿人亂用AI,自己的投稿也將面臨被拒的連帶懲罰論文。

此外,ICLR還提到為了避免誤判,會(huì)結(jié)合工具篩選和人工復(fù)核,試圖通過「人機(jī)共治」,筑起抵御虛假內(nèi)容的新防線論文

在AI時(shí)代,同行評(píng)審機(jī)制正被迫進(jìn)行一場自我進(jìn)化論文

用AI檢測(cè)AI幻覺,用魔法打敗魔法論文

為了應(yīng)對(duì)AI幻覺或造假帶來的學(xué)術(shù)「污染」,首先拿起AI武器的,也應(yīng)當(dāng)是這些AI頂會(huì)論文。

華裔00后戳破頂會(huì)泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

GPTZero背后的兩位年輕創(chuàng)始人

GPTZero之所以能在AI檢測(cè)領(lǐng)域迅速嶄露頭角,離不開它兩位年輕創(chuàng)始人的完美互補(bǔ)論文

Edward Tian

華裔00后戳破頂會(huì)泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

Edward Tian

Edward Tian是GPTZero的CEO ,也是一位擁有華人背景的00后創(chuàng)業(yè)者論文。

就讀普林斯頓大學(xué)期間,他主修計(jì)算機(jī)科學(xué),并輔修新聞方向;在創(chuàng)立GPTZero之前,他曾在Microsoft AI從事過研究工作,也做過BBC調(diào)查報(bào)道相關(guān)實(shí)踐論文。

這些經(jīng)歷讓他更早意識(shí)到:當(dāng)生成式AI大規(guī)模普及后,「內(nèi)容真實(shí)性」與「學(xué)術(shù)誠信」將面臨新的挑戰(zhàn)論文。

2022年底ChatGPT上線引爆關(guān)注之后,Edward Tian在寒假期間快速做出了GPTZero的產(chǎn)品原型,并將困惑度(perplexity)與突發(fā)性(burstiness)等統(tǒng)計(jì)特征作為檢測(cè)的重要指標(biāo)論文。

華裔00后戳破頂會(huì)泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

他認(rèn)為人類寫作在這兩項(xiàng)指標(biāo)上通常表現(xiàn)出更強(qiáng)的隨機(jī)性和結(jié)構(gòu)波動(dòng),據(jù)此能夠推測(cè)出一段文字是人工撰寫還是AI生成的論文。

Alex Cui

華裔00后戳破頂會(huì)泡沫!NeurIPS 53篇論文曝AI造假,LeCun躺槍

Alex Cui

Alex Cui是GPTZero的聯(lián)合創(chuàng)始人兼CTO論文。

他在多倫多大學(xué)完成計(jì)算機(jī)科學(xué)碩士學(xué)位論文。在加入GPTZero之前,曾在自動(dòng)駕駛公司W(wǎng)aabi擔(dān)任研究科學(xué)家。

作為GPTZero的CTO,Alex負(fù)責(zé)推進(jìn)包括為微軟和谷歌產(chǎn)品開發(fā)的插件,幫助用戶在任何文檔或網(wǎng)站上檢測(cè)AI生成的文本論文。

二人并非臨時(shí)組隊(duì),而是高中時(shí)期的好友論文。GPTZero早期團(tuán)隊(duì)組建時(shí),Edward便邀請(qǐng)Alex加入并負(fù)責(zé)技術(shù)推進(jìn)。

參考資料論文

秒追ASI

本站內(nèi)容來自用戶投稿,如果侵犯了您的權(quán)利,請(qǐng)與我們聯(lián)系刪除。聯(lián)系郵箱:[email protected]

本文鏈接://www.cqlhyz.com/post/8202.html

?? /
欧美亚洲日韩国产综合每日更新,国产美女一级A作爱在线观看,亚洲欧洲国产1区二区,国产高清无码精油按摩