遏制AI幻覺:蘋果DeepMMSearch-R1論文揭秘“圖像裁剪”搜索術(shù)

IT之家 1 月 15 日消息,科技媒體 Appleinsider 今天(1 月 15 日)發(fā)布博文,報(bào)道稱蘋果發(fā)表重磅研究論文,詳細(xì)介紹名為 DeepMMSearch-R1 的 AI 模型,重點(diǎn)優(yōu)化 AI 在復(fù)雜視覺場景下的搜索邏輯,用“裁剪”治愈 AI 幻覺論文。

遏制AI幻覺:蘋果DeepMMSearch-R1論文揭秘“圖像裁剪”搜索術(shù)

針對(duì)現(xiàn)有 AI 模型在處理復(fù)雜視覺信息時(shí)常出現(xiàn)的“答非所問”或“漏看”問題,蘋果推出了 DeepMMSearch-R1 模型論文。傳統(tǒng)模型在面對(duì)“圖中左上角那只鳥的最高時(shí)速是多少”這類復(fù)合問題時(shí),往往因無法聚焦局部細(xì)節(jié)而給出錯(cuò)誤的平均數(shù)據(jù)。

DeepMMSearch-R1 引入了獨(dú)特的“視覺定位工具(Grounding Tool)”,能夠主動(dòng)裁剪圖片以剔除干擾信息,先精準(zhǔn)識(shí)別微小目標(biāo),再進(jìn)行針對(duì)性的網(wǎng)絡(luò)搜索驗(yàn)證,從而確保答案的事實(shí)準(zhǔn)確性論文

為確保模型僅在必要時(shí)才啟用裁剪功能以節(jié)省算力,研究人員采用了“監(jiān)督微調(diào)(SFT)+ 在線強(qiáng)化學(xué)習(xí)(RL)”的組合訓(xùn)練法論文。SFT 負(fù)責(zé)教會(huì)模型“不亂剪”,而 RL 則提升了工具調(diào)用的效率。

遏制AI幻覺:蘋果DeepMMSearch-R1論文揭秘“圖像裁剪”搜索術(shù)

展開全文

測(cè)試數(shù)據(jù)顯示,該模型在處理需精準(zhǔn)圖文對(duì)應(yīng)的問題上,表現(xiàn)顯著優(yōu)于目前的 RAG(檢索增強(qiáng)生成)工作流及基于提示詞的搜索智能體,成功解決了 AI 在常識(shí)性事實(shí)檢索中的“偷懶”現(xiàn)象論文。

遏制AI幻覺:蘋果DeepMMSearch-R1論文揭秘“圖像裁剪”搜索術(shù)

IT之家附上參考地址

本站內(nèi)容來自用戶投稿,如果侵犯了您的權(quán)利,請(qǐng)與我們聯(lián)系刪除。聯(lián)系郵箱:[email protected]

本文鏈接://www.cqlhyz.com/tags-%E7%8D%B2%E5%88%91.html

?? /
欧美亚洲日韩国产综合每日更新,国产美女一级A作爱在线观看,亚洲欧洲国产1区二区,国产高清无码精油按摩