大模型究竟開(kāi)源好還是閉源好?近日,圍繞開(kāi)閉源的路線之爭(zhēng),因百度董事長(zhǎng)李彥宏的一則內(nèi)部講話再掀風(fēng)浪。
4月11日晚,百度董事長(zhǎng)李彥宏的內(nèi)部講話曝光,給開(kāi)源大模型潑了不少冷水,他稱大模型開(kāi)源的意義不大,閉源模型在能力上會(huì)持續(xù)領(lǐng)先而做模型的創(chuàng)業(yè)公司既做模型又做應(yīng)用的“雙輪驅(qū)動(dòng)”不是一個(gè)好的模式。
“1.關(guān)于開(kāi)閉源之爭(zhēng),核心是要看誰(shuí)在開(kāi)源。2.雙輪驅(qū)動(dòng),是一線創(chuàng)業(yè)AGI公司的唯一解!钡谝回(cái)經(jīng)記者獨(dú)家獲悉,當(dāng)晚,百川智能CEO王小川在一次微信群討論中發(fā)表了不同觀點(diǎn)。
在群里,金沙江創(chuàng)投主管合伙人朱嘯虎也表示:“GPT4就能實(shí)現(xiàn)90%以上的商業(yè)需求,開(kāi)閉源無(wú)所謂了,以后大模型API就是自來(lái)水的價(jià)格。”他又補(bǔ)充道:“但是用戶需要的是純凈水,氣泡水,烏龍茶……”
大模型生態(tài)社區(qū)OpenCSG的創(chuàng)始人陳冉在接受第一財(cái)經(jīng)記者采訪時(shí)表示,自己對(duì)于開(kāi)源意義不大的說(shuō)法“嚴(yán)重不認(rèn)同”,無(wú)論是國(guó)內(nèi)還是海外,大模型開(kāi)源都已經(jīng)成為一大趨勢(shì),且開(kāi)源趨勢(shì)會(huì)促進(jìn)和推動(dòng)行業(yè)在這之上的商業(yè)化,快速迭代、快速試錯(cuò)、共創(chuàng)共擔(dān),“開(kāi)源只會(huì)越來(lái)越澎湃向上”。
在業(yè)界,堅(jiān)定認(rèn)為閉源大模型好于開(kāi)源大模型的業(yè)界人士,與推動(dòng)大模型開(kāi)源者形成兩股分流。第一財(cái)經(jīng)記者與多名業(yè)內(nèi)人士交流了解到,閉源和開(kāi)源大模型在應(yīng)用場(chǎng)景上形成了初步分化,兩者各有利弊,但在大模型應(yīng)用初期都有生存空間。
閉源還是開(kāi)源好?
在國(guó)內(nèi)科技大廠中,百度、字節(jié)、騰訊、華為等公司目前尚未公布過(guò)開(kāi)源大模型。與此同時(shí),也有不少企業(yè)選擇了閉源與開(kāi)源并行的路線。截至目前,包括阿里通義千問(wèn)、百川智能、360、昆侖萬(wàn)維、智譜AI、浪潮、智源、科大訊飛、零一萬(wàn)物、APUS等都曾發(fā)布不同參數(shù)的開(kāi)源大模型。其中達(dá)到千億參數(shù)的開(kāi)源大模型有APUS-xDAN 大模型4.0(MoE)(1360億)和浪潮信息的“源2.0” 102B(1026億)。
為什么李彥宏認(rèn)為大模型開(kāi)源的意義不是很大?在內(nèi)部講話中,他給出的理由是,有商業(yè)模式的閉源模型才能聚集人力和財(cái)力,中國(guó)和美國(guó)最強(qiáng)的基礎(chǔ)模型都是閉源的,而最好的小模型都是大模型降維做出來(lái)的,而且閉源在成本、效率上有優(yōu)勢(shì),同等能力閉源模型推理成本更低,響應(yīng)速度更快。
他還有另一個(gè)理由,即模型開(kāi)源跟傳統(tǒng)軟件開(kāi)源如Linux、安卓不同,“雖然開(kāi)源模型Llama也鼓勵(lì)大家貢獻(xiàn)各種各樣的數(shù)據(jù)、代碼,但實(shí)際上最主要的開(kāi)發(fā)者就是Meta,不是一個(gè)真正大家一起來(lái)協(xié)同開(kāi)發(fā)的產(chǎn)品。”
站在“閉源”一面的,還有月之暗面創(chuàng)始人楊植麟、他此前曾在接受采訪時(shí)表示,閉源會(huì)有人才聚集和資本聚集,最后一定是閉源更好,海外有幾百個(gè)基于開(kāi)源擴(kuò)散模型Stable Diffusion的應(yīng)用,但沒(méi)有一個(gè)跑出來(lái)。
楊植麟此前還曾提到,以前所有人都可以貢獻(xiàn)到開(kāi)源中,而現(xiàn)在大模型開(kāi)源本身還是中心化的。截至目前,月之暗面并未公開(kāi)提及有關(guān)開(kāi)源大模型的具體計(jì)劃或項(xiàng)目。
更早之前,人工智能科學(xué)家沈向洋在一個(gè)行業(yè)論壇上談及大模型開(kāi)源閉源路徑之爭(zhēng)。他認(rèn)為,業(yè)內(nèi)第一名一定是閉源,第二名他仍然躊躇不定,第三名才會(huì)是開(kāi)源。
但總有人相信開(kāi)源的力量。
一家開(kāi)源不同參數(shù)規(guī)模的模型,同時(shí)也做閉源大模型的負(fù)責(zé)人告訴第一財(cái)經(jīng)記者,模型的能力在不斷發(fā)展,AI領(lǐng)域的技術(shù)創(chuàng)新和突破一直沒(méi)有停止過(guò)。不同的企業(yè)和開(kāi)發(fā)環(huán)境,會(huì)對(duì)模型尺寸、模型能力,以及背后的資源有不同的考慮。有的時(shí)候大家考慮的是極致的性能,有的是有充分的資源,需要更高質(zhì)量的模型。
還有從業(yè)者對(duì)記者表示,李彥宏的意思是創(chuàng)業(yè)者依賴百度大模型就夠了。但目前大模型還處在發(fā)展初期,遠(yuǎn)沒(méi)有誰(shuí)一家獨(dú)大或者壟斷行業(yè)。即便百度是國(guó)內(nèi)較早入局大模型的一個(gè),現(xiàn)在也正面臨著月之暗面Kimi的突襲。
王小川也認(rèn)為,開(kāi)源和閉源并不像手機(jī)中iOS或者安卓操作系統(tǒng)只能二選一,開(kāi)源確實(shí)容易“建立人品”,“朋友多多的”,讓大家迅速了解和評(píng)測(cè)大模型的好壞。同時(shí)開(kāi)源也是為商業(yè)化做準(zhǔn)備,如果大家用起來(lái)覺(jué)得不錯(cuò),當(dāng)需要更好的服務(wù)和更大的參數(shù)時(shí),可以探索進(jìn)一步的商業(yè)化路徑。
此前,阿里云CTO周靖人在接受包括第一財(cái)經(jīng)等媒體采訪時(shí)也曾回應(yīng)路線之爭(zhēng),他稱開(kāi)源社區(qū)已經(jīng)蓬勃發(fā)展起來(lái)了。他稱,阿里云的初衷不是把模型攥在自己手上去商業(yè)化,而是幫助開(kāi)發(fā)者,開(kāi)源生態(tài)對(duì)促進(jìn)中國(guó)大模型的技術(shù)進(jìn)步與應(yīng)用落地,以及生態(tài)的蓬勃發(fā)展至關(guān)重要 。
“從資源、數(shù)據(jù)和人力看,有商業(yè)模式的閉源大模型比開(kāi)源大模型做得好的說(shuō)法,一定程度上是成立的,原因是模型訓(xùn)練成本高,需要財(cái)力支持,例如訓(xùn)練一次要1000萬(wàn)美元!毙吕宋⒉┬录夹g(shù)研發(fā)負(fù)責(zé)人張俊林告訴記者。但從另外一個(gè)角度看,這個(gè)說(shuō)法又不完全正確,因?yàn)楝F(xiàn)在很多開(kāi)源大模型也是大公司做的,也有資源投入。
上海人工智能實(shí)驗(yàn)室領(lǐng)軍科學(xué)家林達(dá)華教授此前接受第一財(cái)經(jīng)采訪時(shí)表示,閉源可能會(huì)在產(chǎn)品打磨上做得更強(qiáng),所以產(chǎn)品成熟度各方面會(huì)更好,而對(duì)于開(kāi)源模型來(lái)說(shuō),在產(chǎn)品成熟度上雖比不過(guò)閉源模型,但它能夠支撐更廣泛的從業(yè)者使用并進(jìn)行二次開(kāi)發(fā),“最后可能開(kāi)源模型的真實(shí)市場(chǎng)占比會(huì)非常高”。他認(rèn)為,開(kāi)源閉源會(huì)呈現(xiàn)出一個(gè)互補(bǔ)的道路,這與過(guò)去計(jì)算機(jī)技術(shù)發(fā)展潮流里操作系統(tǒng)領(lǐng)域的windows和Linux類似。
開(kāi)放原子開(kāi)源基金會(huì)資深法律顧問(wèn)劉偉此前在GDC大會(huì)上表示,閉源模型有幾個(gè)瓶頸,一個(gè)是云端推理的成本太高,如果并發(fā)需求很高可能隨之產(chǎn)生很大的延遲。模型越大其靈活性和經(jīng)濟(jì)性越低,還有模型通常的幻覺(jué)問(wèn)題可能也需要場(chǎng)景的支持才能進(jìn)一步結(jié)合。
“開(kāi)源模型勝在開(kāi)源小模型上,可以靈活部署到終端設(shè)備上,包括PC、手機(jī)上可以實(shí)現(xiàn)低遲延推理的AI體驗(yàn),可以用高質(zhì)量的數(shù)據(jù)訓(xùn)練出垂直領(lǐng)域的應(yīng)用,可以加快大模型在應(yīng)用中賦能千行百業(yè)中,也就是說(shuō)閉源的‘病’開(kāi)源剛好都可以‘治’! 劉偉提到。
MiniMax 技術(shù)副總裁安德森此前對(duì)第一財(cái)經(jīng)記者表示,開(kāi)源和閉源各自都有存在的優(yōu)勢(shì)和價(jià)值。開(kāi)源能吸引更多開(kāi)發(fā)者共同參與,加速技術(shù)的發(fā)展和普及,也能激發(fā)出更多的創(chuàng)新和創(chuàng)意。閉源模型的質(zhì)量和穩(wěn)定性更可控,能更好地保護(hù)知識(shí)產(chǎn)權(quán)、推動(dòng)商業(yè)化落地!拔艺J(rèn)為開(kāi)源和閉源可以相互補(bǔ)充,形成一種更加開(kāi)放、協(xié)作和創(chuàng)新的發(fā)展模式,共同推動(dòng)大模型領(lǐng)域的發(fā)展。”
大模型開(kāi)發(fā)者高曉安(化名)去年便開(kāi)始根據(jù)開(kāi)源模型微調(diào)并在開(kāi)源平臺(tái)上發(fā)布項(xiàng)目,他認(rèn)為,開(kāi)源給大模型生態(tài)帶來(lái)了有利的改變!按竽P烷_(kāi)發(fā)者可以基于開(kāi)源模型做許多二創(chuàng)工作,出現(xiàn)了各種版本的StableDiffusion模型,各種基于Llama模型的中文Llama模型等,這是閉源模型無(wú)法做到的!
高曉安還認(rèn)為,開(kāi)源大模型的另一個(gè)優(yōu)勢(shì)不能忽視,相比使用將公司資料‘喂’給閉源模型可能造成的數(shù)據(jù)泄露問(wèn)題,收集獨(dú)有的業(yè)務(wù)數(shù)據(jù)以訓(xùn)練開(kāi)源模型則少了這方面憂慮,經(jīng)過(guò)訓(xùn)練的模型亦可媲美甚至超越ChatGPT等閉源模型。當(dāng)然,開(kāi)源大模型還有一個(gè)優(yōu)點(diǎn),即給大模型企業(yè)“打廣告”,包括谷歌、阿里、百川智能在內(nèi),都開(kāi)源了參數(shù)量較小的模型,參數(shù)量較大的模型則閉源甚至收費(fèi)。
開(kāi)源ToB閉源ToC?
談?wù)撻_(kāi)源大模型好還是閉源大模型更好,一個(gè)潛在語(yǔ)義是兩者會(huì)在相同的應(yīng)用場(chǎng)景互相較量。但實(shí)際上,目前開(kāi)源大模型和閉源大模型已形成了一定程度的分化。有大模型開(kāi)發(fā)者告訴記者,基于免費(fèi)和數(shù)據(jù)安全考慮,很多公司已在開(kāi)源大模型的基礎(chǔ)上做出了自己的大模型。
“開(kāi)源和閉源形成兩個(gè)陣營(yíng),場(chǎng)景上看,開(kāi)源更傾向于To B,閉源更傾向于To C,是兩個(gè)賽道!睆埧×直硎荆_(kāi)源無(wú)法To C,因?yàn)椴惶峁┚唧w產(chǎn)品,不可能響應(yīng)個(gè)人用戶,但開(kāi)源可以面向企業(yè),企業(yè)可以基于開(kāi)源大模型,獲得在數(shù)據(jù)隱私性上的優(yōu)勢(shì)。
王小川認(rèn)為,從To B角度,開(kāi)源閉源其實(shí)都需要。未來(lái)80%的企業(yè)會(huì)用到開(kāi)源的大模型,因?yàn)殚]源沒(méi)有辦法對(duì)產(chǎn)品做更好的適配,或者成本特別高,閉源可以給剩下的 20%提供服務(wù)。二者不是競(jìng)爭(zhēng)關(guān)系,而是在不同產(chǎn)品中互補(bǔ)的關(guān)系。
林達(dá)華提到,從ToB的角度來(lái)說(shuō),開(kāi)源會(huì)比閉源更好,因?yàn)樗懈蟮拈_(kāi)放性去做二次開(kāi)發(fā)。雖然未來(lái)閉源模型廠商會(huì)推出平臺(tái)化的服務(wù),開(kāi)發(fā)者在上面用其標(biāo)準(zhǔn)化的工具可以做單一行業(yè)和垂直方向的模型。但是各行各業(yè)的需求非常復(fù)雜和多樣化,可能并不是標(biāo)準(zhǔn)化的一套工具鏈能全部覆蓋的。
“很多行業(yè)的企業(yè)和機(jī)構(gòu)會(huì)有需求,想自己掌控整個(gè)模型的迭代,引導(dǎo)到自己需要的方向上去,但他們沒(méi)有基礎(chǔ)模型的投入,也不愿投入太大或沒(méi)有這個(gè)能力,在這種情況下開(kāi)源模型對(duì)他們來(lái)說(shuō)是個(gè)最好的選擇,可以圍繞它做各種細(xì)節(jié)上的二次開(kāi)發(fā),這種開(kāi)發(fā)不一定是標(biāo)準(zhǔn)的工具鏈能夠支撐的!傲诌_(dá)華表示,未來(lái)這種開(kāi)源的模式能夠支撐經(jīng)濟(jì)體系里大量的產(chǎn)業(yè)需求。
對(duì)于閉源模型來(lái)說(shuō),更大的機(jī)遇在一些非常聚集的賽道,“如最后有可能會(huì)出現(xiàn)一個(gè)聊天APP,有非常大的C端流量,這一方向有可能就是一些大廠在一個(gè)商業(yè)化的體系里走出來(lái)。”
林達(dá)華認(rèn)為,閉源大模型核心的邏輯在于它能夠構(gòu)成商業(yè)閉環(huán),能夠有大量的用戶反饋,在固定的渠道里形成壁壘,假設(shè)最終其能找到真正擊中用戶痛點(diǎn)的地方,且通過(guò)用戶的反饋能夠去提升能力,那它就能占住一個(gè)賽道,在這里面進(jìn)行商業(yè)化變現(xiàn)。最終,面向不同的需求,會(huì)有不同的模式,閉源和開(kāi)源會(huì)形成一個(gè)互補(bǔ)的效應(yīng)。
從大模型廠商的選擇層面看,張俊林認(rèn)為,選擇開(kāi)源是一種差異化策略。閉源大模型商業(yè)模式更加清晰,但弊端在于,如果模型效果做不到最好就很難收費(fèi)。而如果走開(kāi)源路線,雖然原則上模型不收費(fèi),但也可以據(jù)此形成商業(yè)模式,就像開(kāi)源的Linux也有商業(yè)模式。所以廠商如果沒(méi)有信心將大模型做到最好,開(kāi)源便是一個(gè)選擇。
張俊林認(rèn)為,開(kāi)源不一定就會(huì)成功,開(kāi)源大模型即便不是最好,也應(yīng)該有特點(diǎn),開(kāi)源大模型應(yīng)有準(zhǔn)確定位。例如走“小而強(qiáng)”路線,參數(shù)量小雖然不如參數(shù)量大的模型效果好,但有成本低、部署簡(jiǎn)單、對(duì)硬件要求不高的特點(diǎn),可以部署至移動(dòng)設(shè)備,應(yīng)用場(chǎng)景多。另外一種選擇則是做大參數(shù),例如Grok,主打性能好的特點(diǎn)。
高曉安在體驗(yàn)后對(duì)記者表示,開(kāi)源大模型和閉源大模型的做法也存在差異。雖然近期開(kāi)源的Grok-1參數(shù)量達(dá)到上千億,但很多開(kāi)源大模型參數(shù)量只有70億、130億參數(shù),如阿里云Qwen-7B、Baichuan2-13B。他告訴記者,相比閉源大模型比拼參數(shù),這些小參數(shù)量開(kāi)源大模型能通過(guò)堆更多預(yù)訓(xùn)練數(shù)據(jù),達(dá)到較好的效果。
“同樣的數(shù)據(jù)量情況下,更大參數(shù)模型的訓(xùn)練收斂速度更快,效果也更好,但訓(xùn)練成本也高很多。而小一些的模型部署成本更低,在實(shí)際業(yè)務(wù)中使用更友好,且有一些實(shí)驗(yàn)表明,70億和130億模型預(yù)訓(xùn)練數(shù)量還沒(méi)達(dá)到飽和的程度!备邥园舱J(rèn)為。
張俊林也認(rèn)為,現(xiàn)在小模型的能力已在快速提升,且能力還看不到上限,原則上只要給小模型更多數(shù)據(jù),效果還會(huì)持續(xù)上升。
不過(guò),高曉安認(rèn)為開(kāi)源大模型也有明顯弊端,若不談開(kāi)源大模型的廣告效應(yīng),開(kāi)源大模型本身商業(yè)化仍存在一定難題。開(kāi)源模型可以考慮針對(duì)商用版本收費(fèi),但在開(kāi)源大模型競(jìng)爭(zhēng)激烈的情況下這種做法比較困難。
開(kāi)源公司的盈利點(diǎn)在哪里?林達(dá)華認(rèn)為,開(kāi)源廠商可以建立一種服務(wù),“有價(jià)值的不完全只是模型本身,而是連帶著它的服務(wù),因?yàn)榛陂_(kāi)源模式做二次開(kāi)發(fā)是相當(dāng)復(fù)雜的事情,在沒(méi)有足夠的技術(shù)支持的情況下,做這個(gè)事的成本會(huì)非常高,這時(shí)候技術(shù)服務(wù)的價(jià)值就能夠發(fā)揮出來(lái)!
對(duì)于開(kāi)源的商業(yè)模式,陳冉認(rèn)為,這個(gè)打法就像互聯(lián)網(wǎng)時(shí)代移動(dòng)應(yīng)用的市場(chǎng)模式,“免費(fèi)試用一段時(shí)間,后面有企業(yè)包裝后的功能或者服務(wù),這個(gè)東西也相當(dāng)于汽車(chē)?yán)锏陌l(fā)動(dòng)機(jī),直接用不起來(lái),需要包裝成整車(chē)(企業(yè)功能)!
“大模型會(huì)展開(kāi)一個(gè)非常大的商業(yè)空間,不同的方式不同的點(diǎn)上,會(huì)有很不一樣的模式,最忌諱的是把所有東西套到一個(gè)‘鞋子’上面。”林達(dá)華對(duì)第一財(cái)經(jīng)說(shuō)。