欧美亚洲自拍偷拍_日本一区视频在线观看_国产二区在线播放_亚洲男人第一天堂

二維碼
企資網(wǎng)

掃一掃關(guān)注

當(dāng)前位置: 首頁 » 企業(yè)資訊 » 資訊 » 正文

禁止大型語言模型胡編亂造_給點(diǎn)外部知識(shí)_推理靠

放大字體  縮小字體 發(fā)布日期:2023-02-19 19:02:32    瀏覽次數(shù):194
導(dǎo)讀

選自arXiv作者:Hangfeng He等機(jī)器之心編譯編輯:王楷該研究提出的 RR(Rethinking with Retrieval)方法不需要額外的訓(xùn)練或微調(diào),也不受大型語言模型(LLM)輸入長度限制,在常識(shí)推理、時(shí)間推理和表格推理任務(wù)中顯

選自arXiv

作者:Hangfeng He等

機(jī)器之心編譯

編輯:王楷

該研究提出的 RR(Rethinking with Retrieval)方法不需要額外的訓(xùn)練或微調(diào),也不受大型語言模型(LLM)輸入長度限制,在常識(shí)推理、時(shí)間推理和表格推理任務(wù)中顯著提高了 LLM 性能。

大型語言模型 (LLM) 已通過 In-context Learning 在各種復(fù)雜任務(wù)上展現(xiàn)出卓越的性能,并且無需針對特定任務(wù)進(jìn)行訓(xùn)練或微調(diào),近期 prompt 和解碼方面取得的進(jìn)展也使 LLM 解決復(fù)雜推理任務(wù)變成了現(xiàn)實(shí)。

然而,LLM 可能會(huì)存儲(chǔ)過時(shí)、不全面或不正確的知識(shí),要將 LLM 成功部署到實(shí)際應(yīng)用中,外部知識(shí)來源(例如維基百科)至關(guān)重要。此前,人們嘗試將知識(shí)用于較小的語言模型 (LM),例如 T5、BERT 和 RoBERTa,但這些方法通常需要額外的訓(xùn)練或微調(diào),成本高昂,對于 LLM 來說完全不切實(shí)際。

基于此,來自羅徹斯特大學(xué)、騰訊 AI Lab 和賓夕法尼亞大學(xué)的研究者聯(lián)合提出了一種稱為 Rethinking with Retrieval (RR) 的后處理方法,以在 LLM 中利用外部知識(shí)。

論文地址:https://arxiv.org/pdf/2301.00303v1.pdf

該研究的思路是首先使用思維鏈 (chain-of-thought,CoT) prompting 方法生成一組不同的推理路徑,類似于 Wang et al. (2022) 的方法。然后該研究使用這些路徑中的每個(gè)推理步驟來檢索相關(guān)的外部知識(shí),讓 RR 方法可以提供更合理的解釋和更準(zhǔn)確的預(yù)測。

該研究使用 GPT-3 175B 和幾種常見的外部知識(shí)源(維基百科、維基數(shù)據(jù)、WordNet 和 Conceptnet)來評估 RR 方法在三個(gè)復(fù)雜推理任務(wù)上的有效性,包括常識(shí)推理、時(shí)序推理和表格推理。實(shí)驗(yàn)結(jié)果表明,無需額外的訓(xùn)練或微調(diào),RR 在這三項(xiàng)任務(wù)上始終優(yōu)于其他方法,這表明 RR 方法在利用外部知識(shí)來提高 LLM 性能方面具有很大優(yōu)勢。

利用檢索進(jìn)行重新思考

實(shí)際上,盡管 LLM 已準(zhǔn)確捕捉了回答問題所需的要素,但這些模型有時(shí)還是會(huì)生成錯(cuò)誤的結(jié)果。這種現(xiàn)象說明 LLM 存儲(chǔ)和檢索知識(shí)的方式存在一些問題,包括:

  • 預(yù)訓(xùn)練語料庫中存在過時(shí)、不正確或缺失的相關(guān)知識(shí);
  • 預(yù)訓(xùn)練時(shí)對相關(guān)知識(shí)的存儲(chǔ)有誤;
  • 推理階段對相關(guān)知識(shí)的錯(cuò)誤檢索。

    RR 方法的大致思路如下:給定一個(gè)輸入問題 Q,RR 方法先利用思維鏈(chain-of though)prompting 生成一組不同的推理路徑 R_1、R_2、……、R_N,其中每個(gè)推理路徑 R_i 由解釋 E_i 和跟在其后的預(yù)測 P_i 組成,然后再從合適的知識(shí)庫 KB 中檢索相關(guān)知識(shí) K_1、……、K_M 來支持每個(gè)推理路徑中的解釋,并選擇最符合該知識(shí)的預(yù)測

    思維鏈(CoT)prompting。與標(biāo)準(zhǔn) prompting 明顯不同,CoT prompting 包括在 prompting 中進(jìn)行分步推理實(shí)例演示來生成一系列捕獲推理過程的短句。

    例如,給定輸入問題:「亞里士多德使用筆記本電腦嗎?」CoT prompting 旨在生成完整的推理路徑:

    CoT prompting 的推理過程為:「亞里士多德死于公元前 322 年。第一臺(tái)筆記本電腦于 1980 年發(fā)明。因此,亞里士多德沒有使用筆記本電腦。所以答案是 no。」而非簡單地輸出「No」。

    對不同的推理路徑采樣。與 Wang et al. (2022) 相似,該研究對一組不同的推理路徑 R_1、R_2、……、R_N 進(jìn)行了采樣,而不是像 Wei et al. (2022) 那樣只考慮最優(yōu)比例路徑(greedy path)。對于「亞里士多德是否使用筆記本電腦?」這一問題,可能的推理路徑如下:

    (R_1) 亞里士多德死于 2000 年。第一臺(tái)筆記本電腦發(fā)明于 1980 年。因此,亞里士多德使用過筆記本電腦。所以該問題的答案為是。

    (R_2) 亞里士多德于公元前 322 年去世。第一臺(tái)筆記本電腦發(fā)明于 2000 年。因此,亞里士多德沒有使用過筆記本電腦。所以答案為否。

    知識(shí)檢索。不同的知識(shí)庫可以用來處理不同的任務(wù)。例如,為了解決「亞里士多德使用筆記本電腦了嗎?」這個(gè)問題,我們可以使用維基百科作為外部知識(shí)庫 KB。信息檢索技術(shù)可用于基于分解的推理步驟從維基百科中檢索相關(guān)知識(shí) K_1、……K_M。理想情況下,針對此問題我們可以從維基百科中獲得以下兩段內(nèi)容:

    (K_1) 亞里士多德(公元前 384 至公元前 322 年)是古希臘古典時(shí)期的希臘哲學(xué)家和博學(xué)大師

    (K_2) 第一臺(tái)筆記本電腦 Epson HX-20 于 1980 年發(fā)明……

    忠實(shí)的推理。我們可以使用函數(shù) f_KB(R_i)來估算每個(gè)推理路徑 R_i 的置信度,該函數(shù)建立在從知識(shí)庫 KB 檢索的相關(guān)知識(shí) K_1、……、K_M 基礎(chǔ)之上。最終的預(yù)測可以通過運(yùn)用以下推斷過程來獲得:

    實(shí)驗(yàn)評估

    本節(jié)中,該研究介紹了 RR 在三個(gè)復(fù)雜推理任務(wù)上的評估:常識(shí)推理、時(shí)序推理和表格推理。

    實(shí)驗(yàn)設(shè)置。在所有實(shí)驗(yàn)中,除非另有說明,該研究都使用 GPT-3 text-davinci-002。實(shí)驗(yàn)完成期間生成的最大 token 數(shù)量被設(shè)置為 256,zero-shot、few-shot 以及 chain-of-thought prompting,溫度參數(shù)(temperature)固定設(shè)置為 0。

    結(jié)果。如表 1 所示,本文提出的方法 RR,在所有三個(gè)推理任務(wù)上始終優(yōu)于所有基準(zhǔn),而無需額外的訓(xùn)練或微調(diào)。這些結(jié)果凸顯出了 RR 在利用外部知識(shí)提高 LLM 表現(xiàn)方面的有效性。

    該研究在 StrategyQA 數(shù)據(jù)集上展示了帶有 CoT prompting 方法的關(guān)于 GPT-3 的分析。在仔細(xì)檢查 GPT-3 的輸出后,該研究觀察到 RR 可以為許多問題提供合理的解釋和正確的預(yù)測。例如,當(dāng)給出「佐治亞州的奧爾巴尼會(huì)在紐約州的奧爾巴尼之前先達(dá)到十萬名住戶嗎?」這個(gè)問題時(shí),GPT-3 產(chǎn)生了以下輸出:

    總體來看對于問題的輸出答案質(zhì)量很高。然而,該研究也觀察到 GPT-3 可能偶爾會(huì)為其解釋提供不正確的事實(shí)支持,或?yàn)槠漕A(yù)測做出不正確的推理,盡管它通常能夠識(shí)別出合適的觀點(diǎn)。

    錯(cuò)誤的支持事實(shí)。如表 2 所示,GPT-3 為 Lil Jon 在 Billboard 榜單中排名最高的歌曲提供了錯(cuò)誤的事實(shí)支持,指出排名最高的歌曲是 Get Low 而非正確答案 Yeah。另外,GPT-3 還做出了錯(cuò)誤的推理,即富士山的山頂不會(huì)高于日本海,而不是正確答案會(huì)高于。

    更多技術(shù)細(xì)節(jié)請參閱原論文。

  •  
    (文/小編)
    免責(zé)聲明
    本文僅代表作發(fā)布者:個(gè)人觀點(diǎn),本站未對其內(nèi)容進(jìn)行核實(shí),請讀者僅做參考,如若文中涉及有違公德、觸犯法律的內(nèi)容,一經(jīng)發(fā)現(xiàn),立即刪除,需自行承擔(dān)相應(yīng)責(zé)任。涉及到版權(quán)或其他問題,請及時(shí)聯(lián)系我們刪除處理郵件:weilaitui@qq.com。
     

    Copyright ? 2016 - 2025 - 企資網(wǎng) 48903.COM All Rights Reserved 粵公網(wǎng)安備 44030702000589號(hào)

    粵ICP備16078936號(hào)

    微信

    關(guān)注
    微信

    微信二維碼

    WAP二維碼

    客服

    聯(lián)系
    客服

    聯(lián)系客服:

    在線QQ: 303377504

    客服電話: 020-82301567

    E_mail郵箱: weilaitui@qq.com

    微信公眾號(hào): weishitui

    客服001 客服002 客服003

    工作時(shí)間:

    周一至周五: 09:00 - 18:00

    反饋

    用戶
    反饋

    欧美亚洲自拍偷拍_日本一区视频在线观看_国产二区在线播放_亚洲男人第一天堂

          久久久一二三| 亚洲午夜久久久| 国产精品成人在线| 久久黄色级2电影| 一区二区欧美国产| 亚洲电影免费在线观看| 午夜精品国产更新| 亚洲精品男同| 在线高清一区| 国模叶桐国产精品一区| 国产精品久久国产三级国电话系列| 亚洲精品日韩在线| 欧美日韩免费观看一区=区三区| 亚洲日本理论电影| 一区二区三区在线免费播放| 国产精品人人做人人爽| 欧美在线精品一区| 亚洲女性喷水在线观看一区| 亚洲每日更新| 日韩视频在线一区二区三区| 亚洲国产色一区| 亚洲成色精品| 亚洲国产精品成人一区二区| 欧美另类专区| 欧美日韩p片| 欧美日韩三级视频| 欧美小视频在线观看| 欧美日韩国产高清| 久久精品国产欧美激情| 午夜一区不卡| 欧美与黑人午夜性猛交久久久| 亚洲大胆美女视频| 亚洲成人直播| 99视频超级精品| 国产真实乱偷精品视频免| 国产一区在线免费观看| 国产亚洲欧美一级| 狠狠色狠狠色综合日日小说| 欧美日韩一区二区在线视频| 欧美日韩亚洲系列| 国产精品激情| 国内综合精品午夜久久资源| 欧美精品一区在线播放| 欧美午夜视频| 国产综合一区二区| 精品999日本| 日韩视频免费| 亚洲国产成人高清精品| av成人激情| 久久成人精品无人区| 亚洲午夜电影网| 欧美在线免费看| 99精品欧美一区二区三区综合在线| 国产欧美一区二区三区另类精品| 欧美美女操人视频| 久久久一区二区| 欧美国产日韩精品| 国产精品―色哟哟| 亚洲第一区中文99精品| 一本一本久久a久久精品综合妖精| 在线观看日韩精品| 亚洲一区二区网站| 欧美v国产在线一区二区三区| 久久激情中文| 欧美午夜久久久| 伊人久久婷婷| 香蕉久久夜色精品国产使用方法| 在线亚洲欧美| 麻豆成人av| 国产日本欧美视频| 亚洲一区二区视频| 亚洲综合色网站| 欧美福利视频| 激情欧美日韩一区| 西西裸体人体做爰大胆久久久| 午夜视频在线观看一区二区三区 | 欧美性一区二区| 欧美成年人网站| 国产一区二区三区免费在线观看| 国产一区二区三区四区在线观看| 国产日韩亚洲欧美精品| 国产人成一区二区三区影院| 亚洲日本中文字幕| 美女爽到呻吟久久久久| 国产一区二区视频在线观看| 亚洲欧美伊人| 国产精品久久久久9999| 在线一区二区三区四区五区| 欧美久久电影| 日韩一区二区精品视频| 欧美激情无毛| 亚洲美女黄网| 欧美中文字幕在线| 免费试看一区| 91久久精品一区| 欧美黄色免费网站| 亚洲国产精品一区二区第一页| 夜夜爽av福利精品导航| 欧美日韩精品欧美日韩精品一| 国产精品成人观看视频国产奇米| 国产日韩一区二区三区在线| 性欧美video另类hd性玩具| 国产精品丝袜xxxxxxx| 午夜亚洲性色视频| 国产视频一区欧美| 日韩一级片网址| 欧美体内she精视频| 亚洲一区3d动漫同人无遮挡| 欧美日韩一区高清| 亚洲欧美韩国| 激情文学一区| 欧美片第一页| 午夜久久久久久| 国产一区二三区| 欧美成在线观看| 一本色道久久综合亚洲精品不| 久久激情一区| 91久久香蕉国产日韩欧美9色| 欧美一区二区三区视频| 精品电影在线观看| 午夜欧美电影在线观看| 狠狠色丁香久久婷婷综合_中| 亚洲视频在线免费观看| 国产日韩欧美二区| 欧美激情精品久久久久久| 亚洲影音先锋| 在线日本高清免费不卡| 欧美视频福利| 狂野欧美激情性xxxx欧美| 99视频一区二区| 国产一区二区中文| 欧美日韩一区二区三区在线视频| 亚洲高清免费在线| 国产精品免费观看视频| 另类欧美日韩国产在线| 小黄鸭精品aⅴ导航网站入口| 欧美亚州在线观看| 麻豆国产精品va在线观看不卡 | 亚洲欧美成人| 亚洲国产精品一区二区www| 国产精品毛片va一区二区三区| 一区二区三区精品在线| 韩国一区二区在线观看| 国产精品久久久对白| 亚洲婷婷免费| 亚洲精品视频在线看| 国内精品久久久| 国产精品久久久久av| 欧美激情麻豆| 老司机一区二区| 久久久噜噜噜久久中文字免| 亚洲欧美日韩视频二区| 国产伦精品一区二区三区照片91 | 免费国产自线拍一欧美视频| 午夜视频久久久久久| 99精品国产99久久久久久福利| 欧美日韩一二三四五区| 欧美理论大片| 欧美成人免费va影院高清| 久久久久成人网| 欧美一区二区三区视频| 亚洲一区二区三区免费观看 | 亚洲激情国产| 激情综合色丁香一区二区| 国产日韩av高清| 国产精品素人视频| 国产欧美丝祙| 国产一区二区成人| 欧美激情一区在线观看| 欧美激情综合网| 亚洲欧美在线网| 先锋亚洲精品| 欧美在线视频二区| 久久爱另类一区二区小说| 在线欧美三区| 亚洲激情不卡| 99国产精品久久| 韩国久久久久| 亚洲精品久久久久| 一本一本a久久| 亚洲欧美精品一区| 欧美在线免费观看视频| 免费一级欧美在线大片| 欧美日韩精品一区二区天天拍小说 | 亚洲理伦电影| 亚洲一区二区三区精品在线观看| 伊人春色精品| 国产欧美日韩视频在线观看| 国产亚洲欧美另类一区二区三区| 欧美精品麻豆| 国产精品一区免费在线观看| 激情综合中文娱乐网| 最新亚洲激情| 亚洲欧美日韩一区二区三区在线观看| 亚洲人体影院| 亚洲欧美日韩精品久久久久| 久久精品成人| 欧美色播在线播放| 激情视频亚洲| 亚洲视频精品|