亚洲婷婷免费_区一区二区三区中文字幕_欧美做受高潮电影o_日韩av电影免费在线_国产精品麻豆入口_无码国产精品96久久久久_99热在线免费_成人性生交大片免费看午夜_成人高清av_欧美三级免费

30億跑贏GPT-3的1750億,谷歌新模型引熱議,然而卻把Hinton年齡搞錯了

前沿科技 3年前 (2022) 虛像
9 0 0

機器之心報道

編輯:澤南、小舟

不增加算力需求,谷歌總結的指令微調方法能讓 8000 萬到 5400 億參數的模型都顯著提升性能。

人工智能一個重要的目標是開發泛化能力強的模型。在自然語言處理(NLP)領域中,預訓練語言模型在這方面取得了重大進展。這類模型往往通過微調來適應新的任務。

近日,來自谷歌的研究者分析了多種指令微調方法,包括擴展對指令微調的影響。實驗表明,指令微調確實可以根據任務數量和模型大小實現良好的擴展,最大到 5400 億參數的模型都能明顯受益,未來的研究應該進一步擴大任務的數量和模型的大小。此外,該研究還分析了微調對模型執行推理能力的影響,結果都是很吸引人的。

由此產生的 Flan-T5 對 1800 余種語言任務進行了指令微調,明顯提高了提示和多步推理能力,30 億參數跑基準就能超過 GPT-3 的 1750 億參數。

30億跑贏GPT-3的1750億,谷歌新模型引熱議,然而卻把Hinton年齡搞錯了

看起來谷歌又為大模型找到了一個能力提升的方向。不過這一研究不僅引來了機器學習社區的歡迎,也有 Gary Marcus 的吐槽:

30億跑贏GPT-3的1750億,谷歌新模型引熱議,然而卻把Hinton年齡搞錯了

谷歌的模型為什么把谷歌自己的著名科學家 Geoffrey Hinton 的出生日期搞錯了?人家明明是 1947 年出生的老前輩。

論文作者之一的谷歌大腦首席科學家 Quoc Le 趕緊出來圓場:是臨時工圖片做錯了,在論文里 Flan-T5 模型其實沒有把 Geoff 的出生年月搞錯,有圖為證。

30億跑贏GPT-3的1750億,谷歌新模型引熱議,然而卻把Hinton年齡搞錯了

順便說一句,出生于 1963 年的著名 AI 學者是 Jürgen Schmidhuber。

既然出錯的不是 AI 模型,讓我們看看谷歌的新方法究竟能夠為預訓練模型帶來哪些改變吧。

論文:Scaling Instruction-Finetuned Language Models

30億跑贏GPT-3的1750億,谷歌新模型引熱議,然而卻把Hinton年齡搞錯了

論文地址:https://arxiv.org/abs/2210.11416

公開模型:https://github.com/google-research/t5x/blob/main/docs/models.md#flan-t5-checkpoints

該研究使用 540B 參數模型訓練 Flan-PaLM,將微調任務的數量增加到 1800 個以上,并包含思維鏈(CoT;Wei et al., 2022b)數據。經過訓練后的 Flan-PaLM 優于 PaLM,在多個基準測試中達到了新的 SOTA。在推理能力方面,Flan-PaLM 能夠利用 CoT 和自洽性(self-consistency;Wang et al., 2022c)在大規模多任務語言理解(MMLU; Hendrycks et al., 2020)上實現 75.2% 的準確率。

30億跑贏GPT-3的1750億,谷歌新模型引熱議,然而卻把Hinton年齡搞錯了

此外,在一組具有挑戰性的開放式生成問題上,Flan-PaLM 的表現明顯優于 PaLM,可用性大幅提高。

總體而言,谷歌的這項研究闡明了使用指令微調來提高模型性能的具體方法。

方法

具體來說,該研究主要關注影響指令微調的幾個方面,包括:(1)擴展任務數量,(2)擴展模型大小,以及(3)對思維鏈數據進行微調。

該研究發現具有上述方面的指令微調顯著改進了各種模型類(PaLM、T5、U-PaLM)、prompting 設置(零樣本、少樣本、CoT)和評估基準(MMLU、BBH、 TyDiQA、MGSM、開放式生成)。例如,在 1.8K 任務上進行指令微調的 Flan-PaLM 540B 大大優于 PALM 540B(平均 + 9.4%)。Flan-PaLM 540B 在幾個基準測試中實現了最先進的性能,例如在五次 MMLU 上達到 75.2%。

研究者還公開了 Flan-T5 檢查點,即使與更大的模型(例如 PaLM 62B)相比,它也能實現強大的少樣本性能。總體而言,指令微調是提高預訓練語言模型的性能和可用性的通用方法。

30億跑贏GPT-3的1750億,谷歌新模型引熱議,然而卻把Hinton年齡搞錯了

圖 1. 研究人員在 1800 余個任務中對各種語言模型進行了微調,在有 / 缺乏樣本(零樣本和少樣本)以及有 / 沒有思維鏈的情況下進行微調,從而能夠在一系列評估場景中進行泛化。

30億跑贏GPT-3的1750億,谷歌新模型引熱議,然而卻把Hinton年齡搞錯了

圖 2. 微調數據包括 473 個數據集、146 個任務類別和共計 1836 個任務。

30億跑贏GPT-3的1750億,谷歌新模型引熱議,然而卻把Hinton年齡搞錯了

在數據微調和程序微調過程完成后,研究者根據模型大小對任務的性能來對比規模擴展的影響。首先,對于所有三種模型大小,多任務指令微調與沒有微調相比性能有很大提高,增益范圍從 9.4% 到 15.5%。其次,增加微調任務的數量可以提高性能。

最后,我們可以看到將模型規模增加一個數量級(8B → 62B 或 62B → 540B)可以明顯提高微調和未微調模型的性能。

30億跑贏GPT-3的1750億,谷歌新模型引熱議,然而卻把Hinton年齡搞錯了

多任務指令微調相對于模型大小(參數量)和微調任務數量及規模擴展對準確率的影響。

30億跑贏GPT-3的1750億,谷歌新模型引熱議,然而卻把Hinton年齡搞錯了

增加微調數據中的任務數量可以提高 Flan-PaLM 在大多數評估基準上的性能。

研究人員證明了在微調混合中包含九個帶有思維鏈 ( CoT ) 注釋的數據集可以提高推理能力。下表顯示 Flan-PaLM 的 CoT 提示能力在四個保留的評估基準上優于 PaLM。

30億跑贏GPT-3的1750億,谷歌新模型引熱議,然而卻把Hinton年齡搞錯了

該研究發現對 CoT 數據進行指令微調的另外一個好處是可以實現零樣本(zero-shot)推理,模型在沒有針對 CoT 的少量樣本的情況下就自行產生了推理能力,這可能需要大量工程調教才能正確實現。

30億跑贏GPT-3的1750億,谷歌新模型引熱議,然而卻把Hinton年齡搞錯了

圖 6:PaLM 和 Flan-PaLM 在一組 23 個具有挑戰性的 BIG-Bench 任務 ( BBH ) 上的 zero-shot 性能。Flan-PaLM 需要通過「讓我們一步一步思考」指令激活的思想鏈 ( CoT ) 生成。

為了展示新方法的通用性,谷歌訓練了 T5、PaLM 和 U-PaLM,涵蓋了從 8000 萬到 5400 億參數的模型體量范圍,發現所有模型都能大幅提升性能。

30億跑贏GPT-3的1750億,谷歌新模型引熱議,然而卻把Hinton年齡搞錯了

表 5. 指令微調 ( Flan ) 在其他持續預訓練方法之上提高了性能。

經過測試,指令微調大大提高了所有模型類型的歸一化平均性能,與非微調模型相比,T5 模型從指令微調中受益最多。這些結果對于某些基準測試來說是相當強的——例如,Flan-T5-XL 只有 30 億參數,就達到了 47.6% 的 MMLU 分數,超過了 GPT-3 1750 億參數的 43.9% 分數。

除了 NLP 基準之外,語言模型還能夠為開放式問題請求生成長格式答案。在這一方面,標準的 NLP 基準和用于評估它們的自動指標不足以衡量人類的偏好。研究人員對此進行了評估,創建了一個包含 190 個示例的評估集。該評估集包括以零樣本方式向模型提出的問題,涉及五個具有挑戰性的類別,每個類別 20 個問題:創造力、上下文推理、復雜推理、計劃和解釋。

對于其中的 60 個示例(來自復雜的推理、計劃和解釋類別),該研究創建了一個帶有思維鏈觸發短語(例如,「讓我們一步一步思考」)的變體,作為微調是否進行的另一個評估在 CoT 上啟用 zero-shot。除了上述 160 個零樣本輸入之外,研究中還包括 30 個用于測試少樣本能力的輸入,這些沒有指令微調的強語言模型已被證明在這些方面表現良好。

研究人員認為,指令微調和規模擴展均可以持續提升大語言模型性能,而微調對于推理能力至關重要,其還能泛化模型能力。通過指令微調與其他模型適應技術(例如 UL2R)結合,谷歌在這項工作中提出了最強模型 Flan-U-PaLM。

重要的是,指令微調并不像模型規模擴展一樣會大幅增加計算成本,例如對于 PaLM 540B,指令微調只需要 0.2% 的預訓練計算,但卻可以將跨評估基準的歸一化平均值提高 9.4%。使用指令微調的小型模型有時可以勝過沒有微調的大模型。

出于這些原因,研究人員建議對幾乎所有預訓練的語言模型都進行指令微調。

原文地址:http://www.myzaker.com/article/63541a748e9f090dee776cae

版權聲明:虛像 發表于 2022年10月24日 am8:36。
轉載請注明:30億跑贏GPT-3的1750億,谷歌新模型引熱議,然而卻把Hinton年齡搞錯了 | 快導航網

相關文章

亚洲午夜久久久| 亚洲免费观看高清| 手机免费看av片| 免费久久久久久久久| 五月天婷亚洲天综合网鲁鲁鲁| 成年女人a毛片免费视频| 91国内精品野花午夜精品| www.5588.com毛片| 日韩高清不卡一区二区三区| 中文字幕欧美精品在线| 免费看国产片在线观看| 国产精品国产a| 久久精品国产亚洲av麻豆色欲| 欧美成人激情| 六月婷婷久久| 黑人精品视频| 国产高清在线不卡| fc2ppv素人在线| 欧美色播在线播放| 日韩三级视频在线播放| 狠狠狠色丁香婷婷综合激情| 久热精品在线播放| 欧美日本成人| 黄色三级中文字幕| 视频精品一区| 91美女高潮出水| 99青草视频在线播放视| 中文字幕不卡av| jizzjizz免费大全| 亚洲第一视频在线观看| 免费国产阿v视频在线观看| 亚洲精选免费视频| 国产一卡二卡三卡| 国产日本一区二区| 日本一级黄色录像| 99国产精品久久久| 久久精品www人人爽人人| 国产福利电影一区二区三区| 男人的天堂av网| 麻豆精品国产传媒mv男同| yy1111111| 久久精品男女| 中文成人无字幕乱码精品区| 日韩精品91| 国产乱子夫妻xx黑人xyx真爽| 午夜精品久久久久久毛片| 成人黄色免费在线观看| 日本高清视频在线观看| 国产精品99久久久久久白浆小说| 黄页网站在线观看| 日韩精品www| 岛国片免费观看| 日韩av在线网| av网站网址| 国产亚洲欧洲高清一区| 国产免费视频| 亚洲国产另类 国产精品国产免费| 色先锋av资源中文字幕| 欧美四级电影网| 亚洲欧美天堂| 欧美精品国产精品| 国产一区二区三区不卡免费观看| 色综合久久88色综合天天| 香蕉国产在线视频| 欧美日韩在线观看一区二区 | 超碰在线97国产| 97超级碰碰| 都市激情综合| 日本在线高清视频一区| 国产区一区二| 亚洲熟妇无码一区二区三区导航| 91成人在线网站| 裸体裸乳免费看| 日日狠狠久久| 丰满女人性猛交| 羞羞答答一区二区| 99视频精品全部免费看| 久久电影天堂| 五月天色婷婷综合| 天堂在线精品| 91n.com在线观看| 亚洲一级黄色| 日本黄色特级片| 亚洲高清电影| v8888av| 国产一区二区福利| 久久久久久久久97| 国产精品123区| 日韩av在线电影| 亚洲欧洲日产国产综合网| 亚洲欧美在线观看视频| 国产精品久久夜| 一级黄色大片视频| 一区二区三区毛片| 五月婷婷一区二区三区| 日韩美女在线视频| 欧美wwwwxxxx| 亚洲精品中文字幕有码专区| 免费看h的网站| 日韩在线视频网| 巨骚激情综合| 欧美激情一区二区三区久久久 | 欧美激情一区二区三区在线| 精品国产免费观看| 亚洲精品水蜜桃| 亚洲av片在线观看| 精品国产乱子伦一区| 91国内精品在线视频| 91精品国产电影| segui88久久综合| 色播五月综合| 免费一区二区三区视频导航| 亚洲综合20p| 激情久久五月天| 91香蕉视频网| 国产欧美一区视频| 正在播放亚洲精品| 欧美亚洲免费在线一区| 狠狠插狠狠操| 午夜精品久久久久久久白皮肤| 精品资源在线看| 99国产高清| 桃色一区二区| 成年人视频大全| 亚洲成人99| 久久久久久久毛片| 国产精品小仙女| 国产天堂第一区| 欧美亚日韩国产aⅴ精品中极品| 四虎激情影院| 日韩欧美亚洲国产另类 | 日韩欧美视频一区二区三区| 国产精品久久久精品a级小说| 亚洲国产精品一区二区三区| 麻豆电影在线| 91久久夜色精品国产网站| 国产亚洲亚洲国产一二区| 激情视频免费网站| 美女视频网站久久| 日韩 国产 欧美| 日韩欧美综合在线视频| 大黑人xxx| 国产精品999| 国产一区二区视频在线看| 国产一区二区在线免费播放| 美女在线观看视频一区二区| 中文字幕永久在线| 91麻豆精品国产91久久久资源速度| 免费看h片网站| 欧美在线亚洲一区| 国产原创一区| 色戒在线免费观看| 国产成人综合自拍| 色av性av丰满av| 欧美日韩一级二级| 91天堂在线| 国产精品91久久久久久| 在线欧美激情| 91精品视频国产| caoporn国产一区二区| 天天综合网在线观看| 一区二区在线免费视频| 中文字幕中文字幕在线中高清免费版| 国产精品乱子乱xxxx| 在线日韩一区| 男人的天堂免费| 91日韩一区二区三区| 先锋资源一区二区| 久久国产精彩视频| 成人免费看片| 国产91视频一区| 国产精品草草| 欧美成人精品欧美一级乱黄| 欧美日韩国产一二三| 一级视频在线免费观看| 久久久久一区二区三区| 99久久精品费精品国产风间由美| 疯狂揉花蒂控制高潮h| 99re在线视频这里只有精品| 亚洲另类图片另类电影| 日韩一区二区三区国产| 两个人看的在线视频www| 超碰97人人射妻| 国产成人精品三级| 亚洲欧洲综合在线| 美女av一区二区三区| 美女精品导航| 中文字幕黄色大片| 免费看亚洲片| 中文字幕av影视| 亚洲人成五月天| 免费看男女www网站入口在线| 亚洲精品久久久久久久蜜桃臀| 黄色综合网站| 黄瓜视频在线免费观看| 精品久久久久久无| 国产激情视频在线| 黄色一级在线视频| 日韩精品视频网站| 国产免费一区二区三区免费视频|