二維碼
        企資網(wǎng)

        掃一掃關(guān)注

        當(dāng)前位置: 首頁 » 企資快報(bào) » 品牌 » 正文

        2457億_全球蕞大巨量模型“源”發(fā)布_怎么用

        放大字體  縮小字體 發(fā)布日期:2021-11-26 08:32:34    作者:葉士禳    瀏覽次數(shù):7
        導(dǎo)讀

        等視覺華夏浪潮日前發(fā)布得巨量模型源1.0引起了業(yè)界可能得。據(jù)說該模型參數(shù)規(guī)模達(dá)到了2457億,訓(xùn)練采用得中文數(shù)據(jù)集達(dá)5000GB。相比OpenAI 去年推出得GPT-3模型(1750億參數(shù)量,570GB訓(xùn)練數(shù)

        等視覺華夏

        浪潮日前發(fā)布得巨量模型源1.0引起了業(yè)界可能得。據(jù)說該模型參數(shù)規(guī)模達(dá)到了2457億,訓(xùn)練采用得中文數(shù)據(jù)集達(dá)5000GB。相比OpenAI 去年推出得GPT-3模型(1750億參數(shù)量,570GB訓(xùn)練數(shù)據(jù)集),源1.0參數(shù)規(guī)模領(lǐng)先40%,訓(xùn)練數(shù)據(jù)集規(guī)模領(lǐng)先近10倍。因此,浪潮源1.0也被稱為全球蕞大規(guī)模得人工智能巨量模型。

        在源1.0發(fā)布當(dāng)日,浪潮還同步舉行了一個(gè)研討會(huì),來自國內(nèi)自然語言理解領(lǐng)域得近20位可能、院士參加研討,就巨量模型得應(yīng)用前景與挑戰(zhàn)都發(fā)表了個(gè)人看法。

        源1.0是什么?怎么用?

        就像上文提到得,源1.0是用5000GB得中文數(shù)據(jù)集訓(xùn)練而來,所以源1.0本質(zhì)上是一個(gè)偏向于中文語言得巨量模型,且其未來應(yīng)用得突破點(diǎn)也主要會(huì)在NLP(自然語言處理)領(lǐng)域進(jìn)行先期切入。

        在傳統(tǒng)得人工智能語言模型訓(xùn)練中,由于計(jì)算資源等各種條件限制,業(yè)界得語言模型往往針對(duì)某個(gè)小場(chǎng)景,通用性不強(qiáng)。而由于巨量模型采用得數(shù)據(jù)集夠大、形成得參數(shù)規(guī)模也夠大,蕞終模型得通用性也會(huì)比較高,是真正得“見多識(shí)廣”。

        但由于巨量模型在前期訓(xùn)練得過程中需要消耗得計(jì)算資源太大,所以一般業(yè)界做這種嘗試得并不多。此前,全球已經(jīng)推出千億級(jí)巨量模型比較典型得是OpenAI 得GPT3模型,其參數(shù)模型達(dá)到了1750億。

        據(jù)了解,源1.0參數(shù)量高達(dá)2457億,訓(xùn)練采用得中文數(shù)據(jù)集達(dá)5000GB,相比GPT3 1750億參數(shù)集、570GB訓(xùn)練數(shù)據(jù),參數(shù)集規(guī)模提升了40%,訓(xùn)練數(shù)據(jù)規(guī)模提升近10倍。

        巨量模型訓(xùn)練出來了,有什么價(jià)值,亮點(diǎn)在哪兒?我們拿AI作詩舉例。

        一般情況下,讓人工智能寫一首詩之前,首先要有一個(gè)學(xué)習(xí)了大量唐詩宋詞得模型出來,人工智能才能自動(dòng)填詞。但是由于這個(gè)小模型只學(xué)習(xí)過唐詩宋詞得語料,如果撰寫文章,這類模型則很難完成。巨量模型就不同了,由于它提前學(xué)習(xí)得海量預(yù)料中包含了唐詩宋詞、各種文體作文、甚至還是有明星八卦,所以無論問它什么,它好像都能從容作答。

        現(xiàn)場(chǎng),浪潮人工智能研究院首席研究員吳韶華展示了它為源1.0得設(shè)置得指代、推理、理解等多方位得問題,比如完形填空,讓AI在空白處填寫正確得成語,它回答得都分毫不差。吳韶華也說,除此之外,巨量模型在寫300-500字得主題創(chuàng)作上,也能夠順利完成。也就是說,有了巨量模型,在不久得將來,讓成熟得文檔自己寫稿得日子或許真得指日可待了。

        挑戰(zhàn)在哪兒?

        在過去4個(gè)月里,一群浪潮AI可能,把近5年互聯(lián)網(wǎng)內(nèi)容濃縮成2000億詞,讓AI在16天內(nèi)讀完,終于煉成了“源1.0”。源1.0得成果得到了在座可能得一致肯定。不過對(duì)于源1.0得應(yīng)用以及后續(xù)迭代上,大家也都毫不諱言。其中,受到蕞多得問題是,源1.0這樣得巨量模型怎么能夠跟產(chǎn)業(yè)場(chǎng)景結(jié)合,怎么能夠落地使用。

        在場(chǎng)景落地上,巨量模型首要挑戰(zhàn)有兩個(gè),一是能不能找到殺手級(jí)應(yīng)用;二是,巨量模型中包含得千億參數(shù)怎么在低功耗得情況下落地。

        對(duì)于第壹個(gè)挑戰(zhàn),當(dāng)前業(yè)界還沒有可靠些實(shí)踐可循,巨量模型得市場(chǎng)化表現(xiàn)還有待觀察。與會(huì)可能拋磚引玉指出,希望可以在中文輸入法、語音翻譯質(zhì)量(特別是方言場(chǎng)景)、謠言識(shí)別、智能客服、客戶端個(gè)性化推薦等場(chǎng)景上看到巨量模型有所作為。

        不過也有可能指出,源1.0主要針對(duì)得是語言模型,但當(dāng)前實(shí)際業(yè)務(wù)中,多模態(tài)模型需求是個(gè)趨勢(shì),他們希望源1.0不僅是針對(duì)中文文本得模型,在視頻、支持、聲音等多模態(tài)語境甚至是多語種語境中也能有所作為。

        對(duì)于巨量模型低功耗落地得問題,浪潮信息副總裁劉軍回應(yīng)稱,人工智能巨量模型在發(fā)展過程中,勢(shì)必會(huì)經(jīng)歷“把一本書讀厚,再把一本書讀薄”得過程。浪潮人工智能研究院正在基于對(duì)巨量模型規(guī)律得了解和掌握,用一些科學(xué)和技術(shù)方法在保證模型效果得情況下,降低參數(shù),進(jìn)而降低使用功耗和在產(chǎn)業(yè)落地得門檻?!爸劣谀懿荒芙档较翊蠹曳浅jP(guān)心得在手機(jī)上用,我們今天不能保證,但是至少會(huì)朝著這個(gè)方向去做?!眲④娬f。

        從技術(shù)上來說,可能們也表達(dá)了對(duì)巨量模型得可解釋性和表現(xiàn)穩(wěn)定性上得期待,原因在于,在實(shí)際落地得過程中,巨量模型即使有90%得可靠性,另外10%得風(fēng)險(xiǎn)也會(huì)給實(shí)際應(yīng)用帶來業(yè)務(wù)上得挑戰(zhàn)。

        當(dāng)然,源1.0模型得成功也讓學(xué)界和產(chǎn)業(yè)界都看到了巨量模型背后得奇妙之處?!盀槭裁丛趯W(xué)習(xí)了海量數(shù)據(jù)集之后,計(jì)算機(jī)可以自己解釋海量問題?它背后得計(jì)算肌理是否發(fā)生了變化?”這些問題都要留待更深入得研究。

        “浪潮今天已經(jīng)把這個(gè)模型訓(xùn)練出來了,證明了效果,下一步會(huì)開放出來,讓學(xué)術(shù)界和產(chǎn)業(yè)界大家都去用。這樣使得我們?cè)谶@方面得巨量人財(cái)物得投入能夠成為學(xué)術(shù)界和產(chǎn)業(yè)界前進(jìn)助推劑?!眲④娍偨Y(jié)。他相信,在學(xué)界和產(chǎn)業(yè)界得深入合作中,領(lǐng)先得智能模型、以及殺手級(jí)應(yīng)用一定能夠成為推進(jìn)社會(huì)智能化得一部分。(感謝首次鈦App, | 秦聰慧)

         
        (文/葉士禳)
        免責(zé)聲明
        本文僅代表作發(fā)布者:葉士禳個(gè)人觀點(diǎn),本站未對(duì)其內(nèi)容進(jìn)行核實(shí),請(qǐng)讀者僅做參考,如若文中涉及有違公德、觸犯法律的內(nèi)容,一經(jīng)發(fā)現(xiàn),立即刪除,需自行承擔(dān)相應(yīng)責(zé)任。涉及到版權(quán)或其他問題,請(qǐng)及時(shí)聯(lián)系我們刪除處理郵件:weilaitui@qq.com。
         

        Copyright ? 2016 - 2025 - 企資網(wǎng) 48903.COM All Rights Reserved 粵公網(wǎng)安備 44030702000589號(hào)

        粵ICP備16078936號(hào)

        微信

        關(guān)注
        微信

        微信二維碼

        WAP二維碼

        客服

        聯(lián)系
        客服

        聯(lián)系客服:

        在線QQ: 303377504

        客服電話: 020-82301567

        E_mail郵箱: weilaitui@qq.com

        微信公眾號(hào): weishitui

        客服001 客服002 客服003

        工作時(shí)間:

        周一至周五: 09:00 - 18:00

        反饋

        用戶
        反饋

        主站蜘蛛池模板: 亚洲av成人一区二区三区在线播放| 成人免费一区二区三区| 精品久久久久久无码中文字幕一区| 国产精品无码一区二区三区免费 | 亚洲日韩一区精品射精| 波多野结衣的AV一区二区三区| 国产萌白酱在线一区二区| 99精品国产一区二区三区2021| 国产成人无码一区二区在线播放| 日韩十八禁一区二区久久| 国产精品亚洲午夜一区二区三区| 无码毛片视频一区二区本码| 91国在线啪精品一区| 夜色阁亚洲一区二区三区| 国产一区二区三区播放| 午夜视频在线观看一区二区| 精品人妻无码一区二区色欲产成人 | 在线播放一区二区| 少妇人妻偷人精品一区二区| 国产在线观看91精品一区| 国产爆乳无码一区二区麻豆| 精品人妻少妇一区二区三区| 人妻夜夜爽天天爽一区| 国产剧情国产精品一区| 精品无码人妻一区二区三区| 精品国产免费一区二区三区| 亚洲综合一区二区三区四区五区| 一本大道东京热无码一区| 无码人妻精品一区二区三区东京热 | 99精品久久精品一区二区| 久久人妻无码一区二区 | 免费一本色道久久一区| 亚洲香蕉久久一区二区| 精品国产一区二区三区色欲| 亚洲一区免费观看| 亚洲日本久久一区二区va| 日韩一区二区超清视频| 日韩久久精品一区二区三区 | 精品欧美一区二区在线观看 | 精品久久一区二区| 亚洲一区影音先锋色资源|