飛象原創(chuàng)(孫迎新/文)很難想象,科學家的腦波興奮點來得如此突然與猝不及防。今天(9月24日)凌晨,隨著OpenAI新一代人工智能大模型o1的推出而變得異;钴S的首席執(zhí)行官山姆奧特曼,破天荒發(fā)布長文《智能時代》,并興奮地寫道:深度學習生效了!
從對OpenAI新一代人工智能大模型的命名就可以看出山姆奧特曼難掩的興奮。o1這簡單的兩個字符極有內涵、寓意深遠。其中的o是orion獵戶座,1代表從頭開始,也意味著后續(xù)將誕生更多序列。至于獵戶座,在科學家們的眼中是無比神圣的,這源于詹姆斯·韋伯太空望遠鏡在獵戶座星云中發(fā)現(xiàn)了關鍵的碳分子甲基陽離子(CH3+),這是一種在星際空間中從未見過的重要碳化合物,除此之外還包括讓天文學家們興奮得手足無措的木星質量二元天體、原恒星、褐矮星等。
o1還有另一個外界比較熟悉的名字,就是此前OpenAI一直在高調宣傳的草莓大模型。OpenAI沒有延續(xù)使用此前的GPT序列,還有另一個重要原因就是其與傳統(tǒng)預訓練模型有新的變革性訓練方法和功能。o1具備復雜推理能力,解決比目前專業(yè)的科學、代碼和數(shù)學模型所能解決的更難的問題。但值得注意的是,相比GPT-4o等其他大模型,o1推理時間較長、使用成本更高,在不需要復雜推理的場景并沒有明顯優(yōu)勢,也意味著o1并非GPT-4o的替代品,兩者將并存,未來不排除實現(xiàn)融合。
這或許也從另一個方面說明o1的問世極其不容易,就連Meta首席AI科學家楊立昆都在為山姆奧特曼捏著一把汗。楊立昆此前憂心忡忡地表示,盡管OpenAI在開始時成功的可能性被認為很低,但其目標是推進人工智能變革,并且應該樂觀地發(fā)展人工智能。
在人工智能的浪潮中,大模型如同一艘巨輪,承載著人類對于智能未來的無限憧憬。隨著技術的不斷進步,我們正站在一個新的起點上,探索如何實現(xiàn)大模型的能力提升,走出一條AI跨越之路。
智能時代的跨越之路:大模型能力提升
在大模型的訓練過程中,傳統(tǒng)的路徑是通過增加模型的參數(shù)量和數(shù)據(jù)量來提升模型的性能。這種方法雖然有效但非常暴力,因為隨著模型規(guī)模的增大,所需的計算資源和數(shù)據(jù)量呈指數(shù)級增長,這不僅對硬件提出極高的要求,也帶來巨大的能源消耗和成本問題。
誕生于中國上海的人工智能領先企業(yè)深蘭科技的創(chuàng)始人陳海波就算過一筆賬,結論就是大模型的訓練相當費錢,這讓公司在大模型的訓練與做高性能的自動駕駛系統(tǒng)、手脈識別系統(tǒng)、DMS司機監(jiān)控系統(tǒng)等之間只能二選一。為此,陳海波非常理智地表示,在大數(shù)據(jù)和云計算的推動下,人工智能將迎來前所未有的發(fā)展機遇,成為引領新一輪科技革命的戰(zhàn)略性技術。
好在隨著OpenAI的o1模型的推出,我們看到另一種新的訓練方式——通過增加學習時間和推理時間來提升模型的能力。o1模型采用了大規(guī)模自我對弈強化學習的方法,讓模型在不斷的自我博弈中學習解決問題,這種方法類似于人類的學習過程,通過不斷的嘗試和糾錯來掌握新技能。o1在數(shù)學、編碼和科學領域的出色表現(xiàn),證明了這種訓練方式的有效性。
然而,增加參數(shù)量和數(shù)據(jù)量依然是提升大模型能力的重要途徑。通過構建更加龐大的模型和使用更加海量的數(shù)據(jù),可以使得模型在理解和生成文本、圖像、音頻等方面更加精準和多樣化。例如,谷歌的“大腦團隊”通過構建更大的模型,使得機器在視覺識別和自然語言處理等領域取得了突破性的進展。此外,商湯科技聯(lián)合創(chuàng)始人、首席科學家王曉剛也認為,AI大模型的進化速度將一日千里,一旦AI收到用戶的海量反饋,“智慧飛輪”會迅速轉動。
同時針對讓大多數(shù)人工智能企業(yè)聞風喪膽的大模型訓練成本問題,騰訊采取的策略是投入大量資源構建基礎模型,并將其應用到每一個業(yè)務線中,以推動產業(yè)實用化。
深度學習:AI向AGI邁進的橋梁
可以毫不夸張地說,深度學習是現(xiàn)代人工智能的基石,也是通往AGI(Artificial General Intelligence通用人工智能)的必由之路。它通過模擬人腦的神經網(wǎng)絡結構,使得機器能夠從數(shù)據(jù)中自動學習和提取特征,完成復雜的任務。隨著深度學習技術的不斷進步,大模型的能力才能得以不斷提升。華為與科大訊飛合作打造基于深度學習的通用大模型底座,被視為中國在該領域的重要里程碑,也體現(xiàn)了雙方在人工智能和信息技術基礎設施上的深厚積累。
深度學習為大模型提供了至關重要的復雜推理能力。o1模型的推出,就展示出深度學習在復雜推理能力上的巨大潛力。它通過內置的思維鏈(CoT)和推理標記,使得模型能夠在解決問題前進行深入的思考,并將推理過程外化,使得模型的決策過程更加透明和可解釋。
深度學習的發(fā)展也推動了大模型在跨模態(tài)能力上的突破。例如,通過深度學習技術,大模型不僅能夠理解和生成文本,還能夠處理圖像、音頻等多種類型的數(shù)據(jù),實現(xiàn)更加豐富和自然的人機交互。
算力提升:計算卡從萬卡向十萬卡演進
算力是推動大模型發(fā)展的核心動力。隨著模型規(guī)模的增大和訓練復雜度的提高,對算力的需求也在不斷增長。對此,華為是深有體會,華為輪值董事長孟晚舟指出,算力的稀缺和昂貴是制約AI發(fā)展的核心因素,因此華為將改變傳統(tǒng)的服務器堆疊模式,以系統(tǒng)架構創(chuàng)新的思路打造AI集群,實現(xiàn)算力提升。
作為智算集群的最小計算單元,人工智能計算卡從萬卡到十萬卡的演進,不僅僅是數(shù)量上的增加,更是對計算資源的優(yōu)化和利用。通過構建更加高效的智算集群,可以更好地支持大模型的訓練和推理,提升模型的性能和應用效果。然而這個過程時刻伴隨著人工智能企業(yè)在成本與性能之間的痛苦摩擦,百度副總裁石清華就表示,人工智能已經從“散裝”的上半場發(fā)展到了“通用”的下半場。只有讓用戶達到降本、提效、增收的目的,才是一個合格的人工智能。
AI基礎設施的建設因此也成為了重中之重。為了支持AI的發(fā)展,需要建設足夠的基礎設施,包括數(shù)據(jù)中心、能源容量和傳輸、半導體制造等。這些基礎設施的建設,將為大模型的訓練和應用提供強大的支持,這一點作為“老牌”人工智能企業(yè)的微軟看得尤其透徹。微軟全球資深副總裁侯陽表示,微軟堅信任何一家公司都需要具備駕馭算力底座支撐中國人工智能事業(yè)的發(fā)展。有了強大的AI基礎設施,人工智能才能展現(xiàn)出巨大潛力,未來每個應用程序都將由人工智能驅動。
總而言之,在智能時代的跨越之路上,大模型的能力提升是我們探索的核心。通過革新訓練方式、深化機器學習技術、提升算力,我們正逐步推動人工智能向通用人工智能邁進。這不僅是技術的突破,更是對人類智慧的一次偉大致敬。未來,隨著技術的不斷進步,我們有理由相信,人工智能將帶來更多的驚喜和可能,開啟一個全新的智能時代。
協(xié)同進化:大模型與小模型共繪AI融合之路
如果說人工智能是浩瀚的星河,那大模型與小模型就猶如兩顆璀璨的星辰,各自散發(fā)著獨特的光芒。人工智能大模型通常指擁有超大規(guī)模參數(shù)(如數(shù)十億甚至數(shù)千億個參數(shù))和復雜計算結構的機器學習模型。這些模型通過深度學習和神經網(wǎng)絡技術,能夠處理大規(guī)模的數(shù)據(jù)集并完成各種復雜的任務,例如自然語言處理、圖像識別等。相對而言,人工智能小模型是指參數(shù)數(shù)量較少、結構相對簡單的機器學習模型。它們在設計和訓練上更注重效率和實用性,適用于資源有限的環(huán)境中。
大模型與小模型:雙星閃耀
在人工智能的世界里,大模型與小模型是兩種截然不同的存在。大模型通常指的是參數(shù)眾多、結構復雜、訓練數(shù)據(jù)龐大的模型,它們在處理復雜任務、進行深度學習和理解時表現(xiàn)出色。而小模型則以其輕量級、快速響應、易于部署的特點,在多種應用場景中展現(xiàn)出獨特的優(yōu)勢。例如,OpenAI的GPT系列模型,通過海量參數(shù)和數(shù)據(jù)的訓練,展現(xiàn)出了令人驚嘆的語言理解和生成能力。
中國在人工智能大模型領域奮起直追,雖然起步稍晚但進展神速。例如,百川智能發(fā)布了超千億大模型Baichuan 3,盡管整體性能還需要追趕GPT-4,但假以時日性能差異將逐步縮小。百川智能的創(chuàng)始人兼CEO王小川表示,百川智能的目標是成為中國最好的大模型,并且正在按部就班地訓練其大模型。此外,智譜AI總裁王紹蘭也表示,智譜AI在技術追趕速度上與百川智能不相上下,智譜AI的GLM-130B在問世后就戰(zhàn)勝了GPT-3。
小模型的應用:助力具身智能的發(fā)展
而人工智能小模型則以其小巧的體積和高效的運算速度,在資源受限的設備上展現(xiàn)出了巨大的應用潛力。它們易于部署,對硬件的要求較低,因此在移動設備、嵌入式系統(tǒng)等領域有著廣泛的應用。例如,智能手機上的語音助手、智能家居控制等,都是小模型的典型應用。
此外,小模型在具身智能的發(fā)展中扮演著重要的角色。具身智能是指通過物理實體與環(huán)境交互,實現(xiàn)智能增長的智能系統(tǒng)。在這一領域,小模型以其輕量級和高效的特點,為智能一體機與人形機器人的發(fā)展提供了強大的動力。商湯科技聯(lián)合創(chuàng)始人徐立就對具身智能表現(xiàn)出濃厚興趣,希望能夠跳出思維定勢,不斷創(chuàng)新嘗試,激發(fā)更多可能性。
就連IT業(yè)元老聯(lián)想也在人工智能領域分到了一杯羹。聯(lián)想推出的智能體一體機,通過高度集成的軟硬件設計,提供了大模型智能應用落地的最小單元。這種一體機通過最優(yōu)算力適配,幫助用戶快速落地智能體,打通了從概念到應用的關鍵環(huán)節(jié)。小模型在這里的應用,使得智能體能夠快速響應,為用戶提供實時的智能服務。
人形機器人是具身智能領域最吸引眼球的存在。在人形機器人上,小模型的應用同樣至關重要。例如,達闥科技的人形機器人Cloud Ginger,通過小模型的應用,實現(xiàn)了迎賓接待、智能問詢、航班查詢等功能,為機場、酒店等場景提供了智能化的服務。小模型的輕量級和高效運算,使得人形機器人能夠更加靈活地與環(huán)境交互,提供更加自然和人性化的服務,畢竟人們在這種場景下,需要的是靈活快速的服務響應,獲得的是來自于科技的情緒滿足價值,而并非是半天不響應,深思熟慮后的專家服務體驗。
大模型獨特的應用領域依然不可取代
與小模型相比,大模型在一些特定的應用領域具有獨特的優(yōu)勢。這些領域通常需要模型具備強大的數(shù)據(jù)處理能力和深度學習能力?拼笥嶏w副總裁劉聰就指出,大模型在數(shù)據(jù)處理能力和智能表現(xiàn)上明顯優(yōu)于傳統(tǒng)的小模型,應該重新審視人工智能的潛力與應用前景。
在科學研究領域,大模型能夠處理和分析海量的科學數(shù)據(jù),為科學家提供強大的輔助。例如,在生物信息學領域,大模型能夠幫助科學家分析復雜的生物數(shù)據(jù),加速藥物研發(fā)和基因研究的進程。
在氣候模擬領域,大模型能夠處理和模擬全球氣候系統(tǒng)的復雜變化,為氣候變化研究提供重要的支持。通過分析歷史氣候數(shù)據(jù)和模擬未來氣候變化,大模型能夠幫助科學家更好地理解氣候變化的規(guī)律,為應對氣候變化提供科學依據(jù)。
在人工智能的發(fā)展道路上,大模型與小模型正如雙星系統(tǒng),相互補充、相互促進。小模型在具身智能領域的應用,為智能一體機與人形機器人的發(fā)展提供了強大的動力;而大模型則在科學研究、氣候模擬等復雜領域展現(xiàn)出了獨特的優(yōu)勢。未來,隨著技術的不斷進步,我們有理由相信,大模型與小模型將共同推動人工智能的發(fā)展,開啟一個全新的智能時代。
AI創(chuàng)新的千面英雄:大模型賦能千行百業(yè)的應用之路
大模型正以其獨特的魅力和力量,逐漸滲透到千行百業(yè)的每一個角落。它們不僅替代了眾多腦力勞動,釋放了人類的創(chuàng)新潛力,還催生了巨大的經濟價值,推動了各行各業(yè)的智能化轉型。大模型作為人工智能領域的集大成者,通過其強大的數(shù)據(jù)處理能力和深度學習能力,在多個領域展現(xiàn)出了無可比擬的優(yōu)勢。它們正在替代一部分腦力勞動,幫助人類釋放更大的創(chuàng)新空間。
在科學研究領域,大模型能夠處理和分析海量的數(shù)據(jù),為科學家提供強大的輔助。例如,DeepMind的AlphaFold在蛋白質結構預測上的突破,極大地加速了生物醫(yī)學研究的進程。在藝術創(chuàng)作領域,大模型能夠生成獨特的藝術作品,激發(fā)藝術家的創(chuàng)作靈感。
在法律、金融、醫(yī)療等行業(yè),大模型通過自然語言處理和知識圖譜技術,能夠自動化處理大量的文檔和數(shù)據(jù),提高工作效率,減少人為錯誤。例如,法律行業(yè)中的合同分析、醫(yī)療行業(yè)中的病例診斷等,大模型的應用正在改變傳統(tǒng)的工作方式。
大模型虹吸效應:創(chuàng)造更大的經濟價值
隨著大模型技術的不斷發(fā)展和應用,一些頭部公司憑借其技術優(yōu)勢和資源積累,正在形成顯著的虹吸效應,創(chuàng)造出更大的經濟價值。
技術優(yōu)勢的積累形成了虹吸效應中的勢能。頭部公司如谷歌、Facebook、百度等,通過持續(xù)的技術研發(fā)和創(chuàng)新,構建了強大的技術壁壘。它們開發(fā)的大模型在性能和應用上遙遙領先,吸引了大量的用戶和合作伙伴,形成了正向的反饋循環(huán)。
而商業(yè)模式的創(chuàng)新則進一步助推了虹吸效應的形成。頭部公司通過大模型技術,探索了新的商業(yè)模式和收入來源。例如,通過提供云服務、API接口、智能硬件等,將大模型技術轉化為實際的商業(yè)價值。此外,大模型技術也為個性化服務和產品提供了可能,滿足了市場的細分需求。
在這場由大模型驅動的智能轉型盛宴中,各大科技企業(yè)紛紛顯露身手。騰訊副總裁、AI lab院長姚星表示,盡管目前人工智能仍處于非常早期的階段,但騰訊的戰(zhàn)略包括打造通用AI、成立機器人實驗室以及聚焦“AI+醫(yī)療”戰(zhàn)略。騰訊的策略是投入大量資源構建基礎模型,并將其應用到每一個業(yè)務線中,以推動產業(yè)實用化。
華為常務董事、華為云CEO張平安在世界人工智能大會(WAIC 2024)上表示,中國應追求在行業(yè)領域構筑大模型的領先地位。
阿里巴巴集團主席蔡崇信則強調了“開放”理念,助力各行業(yè)數(shù)字化轉型,并發(fā)布了AI開源社區(qū)“魔搭”,匯聚了大量開發(fā)者和優(yōu)質模型。
商湯科技聯(lián)合創(chuàng)始人楊帆認為,新一輪AI浪潮帶來了AI產業(yè)發(fā)展的新機遇,大模型并非單純依賴于“暴力美學”,而是背后涉及大量的軟件工程系統(tǒng)問題。未來要推動AI數(shù)據(jù)的基礎設施化,使中國AI產業(yè)持續(xù)發(fā)揮優(yōu)勢,通過構建強大的人工智能基礎設施,為AI所需要的算力、算法和數(shù)據(jù)提供更加規(guī);⒏咝、低成本的基礎支撐。
中國移動九天工業(yè)大模型:賦能千行百業(yè)
9月23日,中國移動以“AI領航,智造未來”為主題,發(fā)布了“中國移動九天·工業(yè)大模型”應用。中國移動九天工業(yè)大模型的發(fā)布,標志著大模型技術在工業(yè)領域的深度融合和應用,為各行各業(yè)的數(shù)字化轉型提供了強有力的支持。
在行業(yè)應用的深度融合方面,九天工業(yè)大模型面向石化、電力、礦山、冶金、裝備制造等重點行業(yè),提供了AI+工業(yè)安監(jiān)、質檢、產業(yè)大腦、輕工廠、設備管理等一系列應用。這些應用通過大數(shù)據(jù)分析和智能算法,優(yōu)化了生產流程,提高了生產效率和安全性。
作為數(shù)字化轉型的加速器,九天工業(yè)大模型的發(fā)布,為工業(yè)企業(yè)的數(shù)字化轉型提供了新的路徑和工具。通過大模型技術,企業(yè)能夠更好地理解市場和客戶需求,優(yōu)化產品設計和制造過程,實現(xiàn)個性化和柔性生產。
發(fā)布會上,安徽移動副總經理邢宏濤表示,在信息化領域,安徽移動持續(xù)推動新型信息服務體系建設,通過深度賦能千行百業(yè),目前已落地超200個5G工業(yè)互聯(lián)網(wǎng)重點項目,覆蓋智慧工廠、智慧礦山、智慧冶金、智慧電力等眾多行業(yè),形成了工業(yè)視覺、AI視頻監(jiān)控、數(shù)據(jù)采集、標識體系、智能巡檢等一批典型“5G+”“AI+”行業(yè)應用。
智能時代的暢想:我們看到的AI未來
大模型作為人工智能領域的千面英雄,正在以其獨特的方式,改變著世界的面貌。它們在千行百業(yè)的廣泛應用,不僅替代了眾多腦力勞動,釋放了人類的創(chuàng)新潛力,還催生了巨大的經濟價值,推動了各行各業(yè)的智能化轉型。隨著技術的不斷進步和應用的不斷深入,我們有理由相信,大模型將在未來發(fā)揮更加重要的作用,成為推動社會進步的重要力量。
山姆奧特曼在其《智能時代》一文中描述了他想象的未來:“我相信未來將會如此光明,以至于沒有人能夠通過文字真正描述它的美好。智能時代的標志性特征將是巨大的繁榮,雖然進展會是漸進的,但一些驚人的成就——如解決氣候問題、建立太空殖民地以及完成物理學的發(fā)現(xiàn)——最終將變得司空見慣。憑借近乎無限的智能和豐富的能源,產生偉大想法以及將這些想法付諸實現(xiàn)的能力,我們能夠做的事情將遠超現(xiàn)在的想象!
是的。這也是我們的智能時代,我們共同的AI未來。
關于人工智能更多前沿新鮮資訊,敬請關注飛象網(wǎng)在2024PT展上的報道。