行業(yè)大模型“飛入尋常百姓家”原創(chuàng)

“大模型”已經(jīng)成為業(yè)界談?wù)摰母哳l詞,而且也呈現(xiàn)出向垂直領(lǐng)域“小而精”發(fā)展的態(tài)勢(shì)。游戲、影視傳媒、辦公、醫(yī)療、金融、電商、廣告、ERP、工業(yè)、家居等領(lǐng)域已經(jīng)出現(xiàn)了基于行業(yè)大模型的相關(guān)應(yīng)用。
通用大模型可以在100個(gè)場(chǎng)景中,解決70%-80%的問(wèn)題,但未必能100%滿足企業(yè)某個(gè)場(chǎng)景的需求。
預(yù)訓(xùn)練模型也就是我們常說(shuō)的通用大模型,它的訓(xùn)練數(shù)據(jù)都是大規(guī)模低成本獲取的,所以通過(guò)訓(xùn)練得出的是某種共性能力。目前市場(chǎng)上有非常多的預(yù)訓(xùn)練模型,像GPT、LLaMA2等。
預(yù)訓(xùn)練模型用學(xué)習(xí)階段來(lái)類比就好比高中,達(dá)到了一個(gè)平均水平,但是如果想要在特定領(lǐng)域有更好水平,就需要進(jìn)一步進(jìn)修到大學(xué),也就是要在預(yù)訓(xùn)練模型上提供更多某領(lǐng)域的知識(shí)進(jìn)行精調(diào)訓(xùn)練。
這也是為什么,從今年3月開始國(guó)內(nèi)出現(xiàn)了“百模”大戰(zhàn)的原因!吨袊(guó)人工智能大模型地圖研究報(bào)告》顯示,截至2023年5月底,國(guó)內(nèi)10億級(jí)參數(shù)規(guī)模以上基礎(chǔ)大模型至少已發(fā)布79個(gè)。2023世界人工智能大會(huì)(WAIC2023)上,國(guó)內(nèi)外30余款大模型集中亮相。
“大模型”已經(jīng)成為業(yè)界談?wù)摰母哳l詞,而且也呈現(xiàn)出向垂直領(lǐng)域“小而精”發(fā)展的態(tài)勢(shì)。游戲、影視傳媒、辦公、醫(yī)療、金融、電商、廣告、ERP、工業(yè)、家居等領(lǐng)域已經(jīng)出現(xiàn)了基于行業(yè)大模型的相關(guān)應(yīng)用。
行業(yè)大模型參數(shù)相對(duì)通用大模型更少,在推理和訓(xùn)練上的成本也更低,但是想要讓大模型在行業(yè)中落地,并不是簡(jiǎn)單的通用模型加上行業(yè)數(shù)據(jù)就可以實(shí)現(xiàn)的。
首先需要將行業(yè)中分散的數(shù)據(jù)集中,其次擁有穩(wěn)定的訓(xùn)練環(huán)境,最后訓(xùn)練上提供高效的算力調(diào)度和利用。綜合看來(lái)不僅要有技術(shù),還要讓技術(shù)和行業(yè)應(yīng)用場(chǎng)景結(jié)合,最后平衡成本、效率和體驗(yàn),才能真正將行業(yè)大模型落地。
本期數(shù)字化轉(zhuǎn)型方略也尋找到行業(yè)大模型中的參與者,他們分享了自己的行業(yè)大模型是如何實(shí)現(xiàn),以及已經(jīng)落地的場(chǎng)景和案例。同時(shí)我們也看到很多企業(yè)正在將行業(yè)大模型的能力開放出來(lái),讓更多的企業(yè)可以受惠。
可以預(yù)見,未來(lái)每一個(gè)企業(yè)都能擁有屬于自己的大模型。
《數(shù)字化轉(zhuǎn)型方略》2023年第9期:http://m.yqqjgz.cn/dxinsight/2309
本文章選自《數(shù)字化轉(zhuǎn)型方略》雜志,閱讀更多雜志內(nèi)容,請(qǐng)掃描下方二維碼

