來源:北京商報(bào)
大模型技術(shù)已經(jīng)成為機(jī)器人(9.530, 0.03, 0.32%)智能化的核心。8月21日,2024世界機(jī)器人大會(huì)開幕,3天主論壇和26場(chǎng)專題論壇聚焦前沿技術(shù)、產(chǎn)業(yè)動(dòng)向和創(chuàng)新成果,大模型是熱門話題。
“可以把大模型看成一個(gè)大號(hào)計(jì)算器,不斷計(jì)算下一個(gè)詞的概率,但是卻能夠涌現(xiàn)出智能”,獵豹移動(dòng)董事長(zhǎng)兼CEO、獵戶星空董事長(zhǎng)傅盛當(dāng)天的類比很接地氣。當(dāng)大模型與機(jī)器人深度融合,機(jī)器人的形態(tài)雖不會(huì)發(fā)生變化,但擁有了更深入的感知、理解和推理能力。在工業(yè)4.0時(shí)代,這種不可見的變化會(huì)打開哪些天花板?大模型和機(jī)器人,哪種驅(qū)動(dòng)關(guān)系更容易實(shí)現(xiàn)?出自機(jī)器人從業(yè)者的答案更有信服力。
“大模型讓機(jī)器人像上過大學(xué)”
一直到ChatGPT出現(xiàn),人工智能技術(shù)的天花板才真正突破。這個(gè)突破意味著什么?
“就像小孩子突然有一天開口叫媽媽,語言能力突飛猛進(jìn)了”,傅盛舉了個(gè)例子,大模型加上機(jī)器人呢?“簡(jiǎn)單說就是機(jī)器人會(huì)更懂這個(gè)世界。”
在他看來,機(jī)器人要做好新質(zhì)生產(chǎn)力工具,就要跟大模型緊密結(jié)合。有這樣一種說法,未來機(jī)器人就是一個(gè)新物種,CPU(中央處理器)、GPU(圖形處理器)對(duì)應(yīng)人類的大腦,大語言模型讓機(jī)器人如同上過大學(xué)。區(qū)別在于,人類的知識(shí)來自于書籍,機(jī)器人來自于自己的學(xué)習(xí),人類的能源來自于食物,機(jī)器人來自于電力。
一般來說,機(jī)器人領(lǐng)域被分為工業(yè)機(jī)器人、服務(wù)機(jī)器人和特種機(jī)器人三種。獵戶星空的產(chǎn)品主要是服務(wù)機(jī)器人,最近在做的端模一體,即將終端和大模型結(jié)合起來,就是所謂的大模型機(jī)器人。
結(jié)合具體場(chǎng)景更容易理解,“比如遞送類機(jī)器人,忙時(shí)送餐、閑時(shí)攬客,沒有大語言模型時(shí)實(shí)現(xiàn)這個(gè)功能非常復(fù)雜,現(xiàn)在直接告訴機(jī)器人,它就能完成”,傅盛舉例道。
遠(yuǎn)舢智能科技聯(lián)合創(chuàng)始人兼CTO李小龍也提到了端模一體化,強(qiáng)調(diào)了技術(shù)層面上的困難,“怎么把模型放到端側(cè),甚至放到設(shè)備的PLC(可編程邏輯控制器)層面做智能控制”。
遠(yuǎn)舢智能科技處在智能制造賽道,李小龍就以此為例,“過去的制造叫批量制造,今天很多制造涉及柔性制造,需要通過大模型的預(yù)測(cè)能力和控制的精確度能力。在這個(gè)賽道,未來做傳統(tǒng)的PLC沒有更多的生存空間,這不是替代的關(guān)系,更多是整個(gè)控制模式的升級(jí),就是把大模型放到PLC層面,直接做設(shè)備控制”。
通用大模型不是必選
根據(jù)IDC最新報(bào)告,2023年中國(guó)大模型平臺(tái)及相關(guān)應(yīng)用市場(chǎng)規(guī)模17.65億元。反觀機(jī)器人領(lǐng)域,2024年6月工業(yè)機(jī)器人產(chǎn)量約5.3萬套,同比增長(zhǎng)12.4%,預(yù)測(cè)2024年中國(guó)工業(yè)機(jī)器人市場(chǎng)規(guī)模將超過700億元。
之所以提到工業(yè)機(jī)器人,是因?yàn)槎嗄陙砉I(yè)機(jī)器人市場(chǎng)規(guī)模最大,高出服務(wù)機(jī)器人和特種機(jī)器人,工業(yè)也是最早從信息化往智能化方向發(fā)展的場(chǎng)景,在工業(yè)場(chǎng)景下機(jī)器人是形態(tài)多元化、本體多樣化、模塊化的。
這背后是專用和通用的區(qū)別,專用的機(jī)器人側(cè)重于整體的效率包括工序、任務(wù)單一化,通用機(jī)器人未來隨著具身智能的發(fā)展,將會(huì)越來越走入千行百業(yè),千家萬戶。具體到大模型,可簡(jiǎn)單對(duì)應(yīng)小參數(shù)的大模型和通用大模型。
“應(yīng)用根據(jù)機(jī)器人應(yīng)用場(chǎng)景選擇大模型,要么是一個(gè)小參數(shù)模型,要么是本地和服務(wù)端相互協(xié)調(diào),優(yōu)勢(shì)是推理成本很低,還解決了隱私問題”,這是傅盛的看法。
穿山甲機(jī)器人股份有限公司董事長(zhǎng)宋育剛同意這個(gè)觀點(diǎn),“作為小企業(yè),不需要通用大模型,不需要很大的參數(shù)。聚焦垂直領(lǐng)域的話,用小參數(shù)模型解決一些特殊的、特定場(chǎng)景的問題,效果反而更好”。
適合非標(biāo)品
既然大模型機(jī)器人是硬件+軟件的結(jié)合,不同背景的公司選擇的路徑自然各異,階段性產(chǎn)品和最終目標(biāo)的差距也在所難免。
“Waymo和特斯拉的例子就很有代表性”,小雨智造聯(lián)合創(chuàng)始人兼CTO王文林類比,一個(gè)專注在自動(dòng)駕駛,技術(shù)做不到某個(gè)程度覺得不可用,另一個(gè)先賣車,技術(shù)慢慢升級(jí)。
回到大模型和機(jī)器人,王文林認(rèn)為,“如果用大模型驅(qū)動(dòng)機(jī)器人,落地的周期相對(duì)會(huì)更長(zhǎng)。先走上機(jī)器人賽道,再加上大模型,慢慢拓展應(yīng)用范圍,我認(rèn)為可能性會(huì)更高一些”。
2023年1月才成立的小雨智造適合回答路徑選擇這個(gè)問題。按照王文林的說法,公司核心技術(shù)是一腦多形的具身智能機(jī)器人,在與北京商報(bào)記者的交流中,他也強(qiáng)調(diào),“公司的目標(biāo)是通用機(jī)器人”。
不過,當(dāng)下小雨智造主要賦能聚焦在智能焊接機(jī)器人,“傳統(tǒng)的自動(dòng)化行業(yè)四大家族已經(jīng)能夠完全實(shí)現(xiàn)成熟的自動(dòng)化生產(chǎn),但對(duì)于非標(biāo)品,對(duì)于柔性要求特別大的產(chǎn)品,反而沒有一個(gè)很好的解決方式,這正好是大模型的優(yōu)勢(shì),更智能、更柔性”,王文林說。
北京微鏈道愛科技有限公司總經(jīng)理張宇的觀點(diǎn)有相似之處,“每個(gè)項(xiàng)目都是獨(dú)立的,每做一個(gè)項(xiàng)目都要做大量數(shù)據(jù)的采集、標(biāo)注,相當(dāng)于每個(gè)項(xiàng)目是重新來,這種情況下這個(gè)商業(yè)邏輯不能跑下去,這樣就沒辦法走下去,真正能掙錢的AI一定是可塑造性的大模型”,他更愿意在通用大模型后面加上關(guān)鍵詞“可塑造”。
北京商報(bào)記者 魏蔚