6月14日,2024北京智源大會在京舉行。全球領先真機實驗成功率突破95%的泛化抓取技術、全球首個端到端基于視頻的多模態(tài)具身導航大模型NaVid、全球首個智能心臟超聲機器人等多項人工智能領域的創(chuàng)新成果集結亮相,引發(fā)業(yè)內關注。
開幕式上,北京智源人工智能研究院院長王仲遠作2024智源進展報告,介紹了智源研究院在語言、多模態(tài)、具身、生物計算大模型領域的前沿探索和研究進展,以及大模型全棧開源技術基座的迭代升級與版圖布局。
王仲遠介紹,現(xiàn)階段語言大模型已具備一定的理解和推理能力,但這并不是讓人工智能感知、理解物理世界的終極技術路線。未來大模型將以數(shù)字智能體的形態(tài)與智能硬件融合,以具身智能的形態(tài)從數(shù)字世界進入物理世界。
中關村科學城管委會副主任、海淀區(qū)副區(qū)長唐超表示,海淀區(qū)擁有一大批頂尖科學家和產業(yè)領軍人才,在產業(yè)發(fā)展方面,已基本形成芯片、框架、大模型、數(shù)據(jù)技術與處理服務等全產業(yè)鏈部署,集聚企業(yè)超千家,占全市的2/3、全國的1/6。海淀區(qū)將規(guī)劃全球首個人工智能街區(qū),以五道口和大鐘寺為先導區(qū),規(guī)劃53平方公里建設人工智能創(chuàng)新策源地和產業(yè)高地,強化產學研用一體化的協(xié)同創(chuàng)新。
在零一萬物、創(chuàng)新工場董事長李開復與清華大學智能產業(yè)研究院院長、智源學術顧問委員張亞勤的對話中,張亞勤歸納了大模型的“三個做對了”和“三個需改進”。他說,規(guī)模定律、“Token-Based”(“基于詞元的機制”)、通用性是現(xiàn)階段大模型的正確選擇。與此同時,當前大模型也面臨效率低下、未能真正理解物理世界、邊界問題的挑戰(zhàn),有待進一步解決。
人工智能技術正在加速進步,產業(yè)進入爆發(fā)期。百度首席技術官王海峰認為,大模型為通用人工智能帶來曙光,可以從兩個角度解讀,一是人工智能技術的通用性,二是能力的全面性。從人工智能技術發(fā)展趨勢來看,未來幾年,規(guī)模定律依然有效,大語言模型仍有很大提升空間,多模態(tài)大模型會越來越好用,智能體技術逐漸成熟從而加速應用爆發(fā)。
北京智源大會由北京智源人工智能研究院主辦,以“全球視野、思想碰撞、前沿引領”為特色,匯聚海內外研究者分享研究成果、探尋前沿知識、交流實踐經(jīng)驗。自2019年10月首度亮相至今,大會已成功舉辦5屆,成為國際人工智能交流的一張名片。