国产精品天天狠久久久天天,亚洲国产日韩a在线亚洲,精品国产sm全部网站,99久久免费国产香蕉麻豆

華裔00后戳破頂會(huì)泡沫！NeurIPS 53篇論文曝AI造假，LeCun躺槍

新智元報(bào)道

編輯論文：元宇

【新智元導(dǎo)讀】用AI檢測(cè)AI幻覺，用魔法打敗魔法！剛剛，NeurIPS已收錄論文被曝出數(shù)百條AI幻覺引用，至少53篇論文中招論文。為了對(duì)抗AI幻覺、造假所帶來的學(xué)術(shù)「污染」，首先拿起AI武器的，也應(yīng)當(dāng)是AI頂會(huì)。

數(shù)百項(xiàng)虛假引用論文，53篇頂會(huì)論文被抓包！

剛剛，NeurIPS頂會(huì)暴雷，全球AI圈的「奧斯卡」盛會(huì)，被一家華人00后的AI初創(chuàng)公司「打假」了論文。

這家名為GPTZero的公司在掃描了NeurIPS 2025年所接收的4841篇論文后，發(fā)現(xiàn)了數(shù)百條由AI「編造」出來的引用，至少53篇論文「證據(jù)確鑿」論文。

GPTZero CEO Edward Tian將其稱作一個(gè)重要的節(jié)點(diǎn)時(shí)刻論文：

這是首次有記錄顯示，幻覺引用進(jìn)入了頂級(jí)機(jī)器學(xué)習(xí)會(huì)議的官方文獻(xiàn)論文。

展開全文

GPTZero聯(lián)合創(chuàng)始人兼CEO Edward Tian（左）與聯(lián)合創(chuàng)始人兼CTO Alex Cui（右）論文。

當(dāng)「John Smith」這種占位符名字（類似中國的張三、李四），堂而皇之地出現(xiàn)在頂會(huì)參考文獻(xiàn)中，這意味著學(xué)術(shù)研究的基石已經(jīng)被AI幻覺「侵蝕」了論文。

更離譜的是，在GPTZero展示的例子中，圖靈獎(jiǎng)得主Yann LeCun的名字，以「Samuel LeCun Jackson」的虛構(gòu)引用形式，出現(xiàn)在了另一篇有關(guān)深度學(xué)習(xí)的論文中論文。

學(xué)術(shù)引用的嚴(yán)謹(jǐn)性對(duì)于科研的意義不言而喻論文。

當(dāng)謊言被引用了一千次，它在數(shù)據(jù)集中就變成了真理論文。

如果不加干預(yù)，未來的研究者在引用這些「經(jīng)典」時(shí)，就像是在虛無縹緲的云端建造空中樓閣論文。

以前科學(xué)家們的研究是站在了巨人的肩膀上，今后很可能是站在AI的幻覺之上了論文。

53篇論文驚現(xiàn)AI幻覺引用

頂會(huì)濾鏡破碎

在AI學(xué)術(shù)圈，NeurIPS長期以來被視為一座「圣殿」論文。

在這里發(fā)表論文，幾乎等同于拿到了進(jìn)入Google DeepMind或OpenAI等頂級(jí)實(shí)驗(yàn)室的入場券論文。

然而，這層看上去高大上的「神圣濾鏡」，卻被GPTZero擊碎了論文。

他們對(duì)NeurIPS 2025已正式發(fā)表的4841篇論文進(jìn)行了一次「地毯式掃描」論文，結(jié)果猶如一記重磅炸彈：

至少53篇論文，被檢測(cè)出包含數(shù)百條由大模型憑空捏造的引用論文。

最令人震驚的是，這些連鏈接都可能指向404的低級(jí)錯(cuò)誤，竟悉數(shù)「騙」過了每篇論文至少三名專家的同行評(píng)審防線論文。

NeurIPS 2025現(xiàn)場

頂會(huì)的尊嚴(yán)，在AI幻覺面前，顯得不堪一擊論文。

如上圖，在GPTZero的官方博客中，公布了53篇NeurIPS論文中發(fā)表的100條虛構(gòu)引用列表論文。

在上圖所顯示的這篇論文中，GPTZero檢測(cè)到存在一篇標(biāo)題相同的文章，作者顯然是偽造的論文。

在上面這篇關(guān)于深度學(xué)習(xí)技術(shù)的論文中，顯示無作者或標(biāo)題匹配，說明該文章不存在于出版物中，其URL和DOI均為偽造論文。

GPTZero曾嘗試通過多種名稱來描述AI生成的幻覺引用論文。

「幻覺引用」（hallucinated citations）太長，「虛假引用」（fake citations）則帶有過強(qiáng)的道德評(píng)判色彩論文。

Alex Adams

最終，GPTZero機(jī)器學(xué)習(xí)主管Alex Adams提出了「氛圍引用」（vibe citing）一詞，用來描述大模型將真實(shí)來源進(jìn)行推導(dǎo)或拼湊，從而生成看似逼真卻是虛假信息的傾向論文。

「氛圍引用」與「氛圍寫作」（vibe writing）或「氛圍編碼」（vibe coding）類似，其生成的引用乍看之下似乎準(zhǔn)確無誤，但經(jīng)不起仔細(xì)推敲論文。

利用AI撰寫研究論文迅速流行，體現(xiàn)了「氛圍引用」（vibe-citing）的快速增長

從上圖中可以看出，2025年4月和9月的峰值分別對(duì)應(yīng)NeurIPS和ICLR 2025的論文提交截止日期論文。

AI幻覺的進(jìn)化

Edward Tian認(rèn)為，NeurIPS的情況更令人擔(dān)憂，因?yàn)閱栴}出現(xiàn)在已經(jīng)被正式接收并發(fā)表的論文中論文。

根據(jù)傳統(tǒng)的學(xué)術(shù)規(guī)范，即便只有一條偽造引用，也足以構(gòu)成拒稿理由論文。

NeurIPS 2025主賽道論文的接收率為24.52%，這意味著這些存在幻覺引用的論文擊敗了約15000篇競爭對(duì)手論文。

這些「AI幻覺」造成的引用問題，通過了同行評(píng)審，并被收錄進(jìn)最終的會(huì)議論文集論文。

因此，Edward Tian認(rèn)為這次問題，相比以往是一次明顯的升級(jí)，也是首次有記錄顯示幻覺引用進(jìn)入了頂級(jí)機(jī)器學(xué)習(xí)會(huì)議的官方文獻(xiàn)論文。

在GPTZero曝光的部分案例中，我們看到了AI幻覺的驚人進(jìn)化論文。

最初級(jí)錯(cuò)誤

最初級(jí)錯(cuò)誤，是論文參考文獻(xiàn)中出現(xiàn)了「John Smith」和「Jane Doe」這樣的占位姓名，甚至還有引用鏈接直接指向404空頁面論文。

而且，這種初級(jí)錯(cuò)誤竟然逃過了世界頂級(jí)專家的法眼論文。

「半真半假」的隱蔽偽造

這是一種更危險(xiǎn)、更深度，也更隱蔽的一種偽造論文。

AI可能會(huì)把多篇真實(shí)論文的內(nèi)容拼接或改寫，生成看起來十分可信的標(biāo)題和作者列表論文。

它還會(huì)把一篇題為「深度學(xué)習(xí)的優(yōu)化」的論文，改寫成「深度學(xué)習(xí)中的優(yōu)化策略」論文。

乍看上去作者和關(guān)鍵詞都對(duì)，格式也是BibTeX的標(biāo)準(zhǔn)格式論文。

審稿人在快速瀏覽時(shí)，大腦會(huì)自動(dòng)補(bǔ)全這些信息，覺得這篇文獻(xiàn)很眼熟，于是就通過了論文。

GPTZero之所以能發(fā)現(xiàn)「AI幻覺」，是因?yàn)樗慕Y(jié)果是基于事實(shí)的對(duì)照論文。

據(jù)Alex Cui介紹，GPTZero的幻覺檢測(cè)工具會(huì)讀取論文全文，通過搜索開放網(wǎng)絡(luò)和學(xué)術(shù)數(shù)據(jù)庫，逐條核實(shí)引用的作者、標(biāo)題、發(fā)表渠道和鏈接論文。

如果一條引用在現(xiàn)實(shí)世界找不到對(duì)應(yīng)，或者只與真實(shí)論文部分匹配，系統(tǒng)就會(huì)拉響警報(bào)論文。

失守的防線

「投稿海嘯」與審稿過載困境

如此低級(jí)的錯(cuò)誤論文，為什么會(huì)繞過層層把關(guān)的審稿系統(tǒng)？

答案很現(xiàn)實(shí)：由于內(nèi)卷，學(xué)術(shù)界的「算力」已經(jīng)跟不上了論文。

ICLR、NeurIPS、ICML和AAAI這些全球AI頂會(huì)，每年吸引數(shù)千篇投稿和大量參與者論文。

由于AI、論文工廠以及發(fā)表壓力所引發(fā)的「投稿海嘯」，已使所有這些會(huì)議的審稿流程不堪重負(fù)，瀕臨崩潰論文。

比如，2020年至2025年間，NeurIPS的投稿量從9467篇激增超過220%，達(dá)到21575篇，遠(yuǎn)高于2024年的15671篇和2023年的12343篇論文。

即便會(huì)議組織者動(dòng)員了成千上萬名志愿評(píng)審，但對(duì)于每篇論文及其參考文獻(xiàn)進(jìn)行深入審查也變得越來越難論文。

這就為AI幻覺的出現(xiàn)留下了可乘之機(jī)論文。

對(duì)此論文，NeurIPS理事會(huì)的官方回應(yīng)顯然有些蒼白：

1.1%的論文因使用大模型而包含一個(gè)或多個(gè)錯(cuò)誤引用，也并不意味著論文內(nèi)容本身一定無效論文。例如，作者可能只是向大模型提供了不完整的引用信息，并讓模型生成BibTeX（格式化參考文獻(xiàn)）。

但是，這種說法在學(xué)術(shù)態(tài)度上也無法站住腳論文。

如果一位作者連自己的參考文獻(xiàn)都懶得核實(shí)論文，直接甩給AI去生成，且不進(jìn)行復(fù)查，我們又怎能相信他在復(fù)雜的實(shí)驗(yàn)數(shù)據(jù)上保持了嚴(yán)謹(jǐn)？

就像Hacker News中一位網(wǎng)友說的那樣，看到這些被標(biāo)注錯(cuò)誤的論文，會(huì)讓自己停下來思考：這篇論文的其它部分有多少是借助了AI輔助完成的論文。

「如果這些是僅有的錯(cuò)誤，我們并不擔(dān)憂，但無法確定這些就已經(jīng)是全部的錯(cuò)誤論文。這些錯(cuò)誤表明該論文在提交時(shí)未經(jīng)過徹底的幻覺檢查，作者在使用AI時(shí)也缺乏應(yīng)有的謹(jǐn)慎。」

用魔法打敗魔法

NeurIPS「翻車」不止是「氛圍引用」那么簡單，它動(dòng)搖的是科研誠信的基石論文。

科研就像一場接力賽論文。以AI研究為例，它高度依賴「可復(fù)現(xiàn)性」和「溯源」。

就像Edward Tian所說的：「AI研究結(jié)果向來難以復(fù)現(xiàn)，因此引用至關(guān)重要論文。」

真實(shí)準(zhǔn)確的引用，能幫助研究者判斷某個(gè)結(jié)果是否可復(fù)現(xiàn)，并讓他人追溯到具體、可驗(yàn)證的來源進(jìn)行測(cè)試論文。

因此論文，如果「氛圍引用」的現(xiàn)象不加以遏制，我們將面臨一種可怕的「近親繁殖」效應(yīng)：

AI生成了包含幻覺的論文，這些論文被收錄進(jìn)數(shù)據(jù)庫，下一代AI模型又拿這些數(shù)據(jù)進(jìn)行訓(xùn)練論文。

最終，AI開始從自己的幻覺中學(xué)習(xí)知識(shí)，導(dǎo)致模型的崩塌論文。

GPTZero的曝光旨在警示行業(yè)漏洞：舊有的「評(píng)審體系」，已難以應(yīng)對(duì)投稿量激增和AI使用所帶來的問題論文。

如何捍衛(wèi)同行評(píng)審的尊嚴(yán)論文？

另一大頂會(huì)ICLR（國際表征學(xué)習(xí)大會(huì)）已經(jīng)覺醒并開始行動(dòng)論文。

ICLR將于今年4月舉辦，吸取了NeurIPS的教訓(xùn)后，它迅速聯(lián)手GPTZero，已啟動(dòng)了嚴(yán)格的「排雷」行動(dòng)論文。

此前，在GPTZero針對(duì)ICLR的一項(xiàng)投稿調(diào)研中，已經(jīng)發(fā)現(xiàn)了50條成功躲過評(píng)審的虛假引用論文。

去年11月，ICLR還發(fā)布了關(guān)于大模型生成論文及評(píng)審的應(yīng)對(duì)策略論文。

ICLR發(fā)出的信號(hào)非常明確：不封殺AI，但必須透明論文。

幻覺引用被定性為違反「道德準(zhǔn)則」（Code of Ethics），一旦發(fā)現(xiàn)大量使用AI未披露或存在虛假內(nèi)容，將直接拒稿/桌拒（Desk Reject）論文。

更狠的是，審稿人亂用AI，自己的投稿也將面臨被拒的連帶懲罰論文。

此外，ICLR還提到為了避免誤判，會(huì)結(jié)合工具篩選和人工復(fù)核，試圖通過「人機(jī)共治」，筑起抵御虛假內(nèi)容的新防線論文。

在AI時(shí)代，同行評(píng)審機(jī)制正被迫進(jìn)行一場自我進(jìn)化論文。

用AI檢測(cè)AI幻覺，用魔法打敗魔法論文。

為了應(yīng)對(duì)AI幻覺或造假帶來的學(xué)術(shù)「污染」，首先拿起AI武器的，也應(yīng)當(dāng)是這些AI頂會(huì)論文。

GPTZero背后的兩位年輕創(chuàng)始人

GPTZero之所以能在AI檢測(cè)領(lǐng)域迅速嶄露頭角，離不開它兩位年輕創(chuàng)始人的完美互補(bǔ)論文。

Edward Tian

Edward Tian是GPTZero的CEO ，也是一位擁有華人背景的00后創(chuàng)業(yè)者論文。

就讀普林斯頓大學(xué)期間，他主修計(jì)算機(jī)科學(xué)，并輔修新聞方向；在創(chuàng)立GPTZero之前，他曾在Microsoft AI從事過研究工作，也做過BBC調(diào)查報(bào)道相關(guān)實(shí)踐論文。

這些經(jīng)歷讓他更早意識(shí)到：當(dāng)生成式AI大規(guī)模普及后，「內(nèi)容真實(shí)性」與「學(xué)術(shù)誠信」將面臨新的挑戰(zhàn)論文。

2022年底ChatGPT上線引爆關(guān)注之后，Edward Tian在寒假期間快速做出了GPTZero的產(chǎn)品原型，并將困惑度（perplexity）與突發(fā)性（burstiness）等統(tǒng)計(jì)特征作為檢測(cè)的重要指標(biāo)論文。

他認(rèn)為人類寫作在這兩項(xiàng)指標(biāo)上通常表現(xiàn)出更強(qiáng)的隨機(jī)性和結(jié)構(gòu)波動(dòng)，據(jù)此能夠推測(cè)出一段文字是人工撰寫還是AI生成的論文。

Alex Cui

Alex Cui是GPTZero的聯(lián)合創(chuàng)始人兼CTO論文。

他在多倫多大學(xué)完成計(jì)算機(jī)科學(xué)碩士學(xué)位論文。在加入GPTZero之前，曾在自動(dòng)駕駛公司W(wǎng)aabi擔(dān)任研究科學(xué)家。

作為GPTZero的CTO，Alex負(fù)責(zé)推進(jìn)包括為微軟和谷歌產(chǎn)品開發(fā)的插件，幫助用戶在任何文檔或網(wǎng)站上檢測(cè)AI生成的文本論文。

二人并非臨時(shí)組隊(duì)，而是高中時(shí)期的好友論文。GPTZero早期團(tuán)隊(duì)組建時(shí)，Edward便邀請(qǐng)Alex加入并負(fù)責(zé)技術(shù)推進(jìn)。

參考資料論文：

秒追ASI

華裔00后戳破頂會(huì)泡沫！NeurIPS 53篇論文曝AI造假，LeCun躺槍

海之嵐財(cái)稅公司

熱門標(biāo)簽

相關(guān)詞匯

分站導(dǎo)航

華裔00后戳破頂會(huì)泡沫！NeurIPS 53篇論文曝AI造假，LeCun躺槍

海之嵐財(cái)稅公司

熱門標(biāo)簽

相關(guān)詞匯

分站導(dǎo)航

華裔00后戳破頂會(huì)泡沫！NeurIPS 53篇論文曝AI造假，LeCun躺槍