首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|芯片報告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 頭條資訊 >> 正文

百度的大模型學費

2024年4月17日 07:07  北京商報  

前一天在極越車內直播,第二天又為大模型工具“打call”,百度CEO李彥宏無縫銜接。4月16日,他花了約一個小時講解百度最新發(fā)布的AI開發(fā)工具,再度吐槽開源模型落后。像往年一樣,百度眾高管在Create大會上秀數(shù)據(jù)、講功能、談未來,但行業(yè)格局已大不一樣。

2023年3月,百度搶先發(fā)布文心大模型及產品文心一言,同年10月拿出最新版文心大模型4.0,一年時間文心一言用戶超2億。競爭對手的動作也不慢,月之暗面異軍突起,Sora表現(xiàn)震撼,文心一言AI應用老大的位置則遭到威脅。李彥宏說這一年百度開發(fā)AI原生應用踩了坑,交了學費。而當日百度以95港元在港交所開盤,收盤時股價94.15港元。

三個工具

上午9點多,李彥宏開講,《人人都是開發(fā)者》的題目和臺下的開發(fā)者和科技愛好者的適配度很高。

“過去,開發(fā)者用代碼改變世界;未來,自然語言將成為新的通用編程語言,你只要會說話,就可以成為一名開發(fā)者,”李彥宏強調,“未來開發(fā)應用就像拍個短視頻一樣簡單。”

基于上述判斷,百度上新了“開發(fā)工具”:針對智能體開發(fā)的AgentBuilder、針對AI原生應用開發(fā)的AppBuilder,以及各種尺寸的模型定制工具ModelBuilder。

李彥宏認為,智能體可能是未來每一個人最近、最主流的大模型使用方式。百度升級的文心智能體平臺上有3萬多個智能體被創(chuàng)建、5萬多名開發(fā)者和上萬家企業(yè)入駐。

智能體方面的進展也是瑞達恒研究院經(jīng)理王清霖關注的內容,“具有更廣泛的發(fā)展前景,可以應用于C端的各種場景進行內容生成。由于這種模式的使用門檻低、場景多,可以兼顧工作與日常、個人與企業(yè),并且可以涉及到很多業(yè)態(tài)的多個環(huán)節(jié),看起來是更具有發(fā)展?jié)摿Φ,只是如何商業(yè)變現(xiàn)是挑戰(zhàn)”。

AppBuilder是用來開發(fā)AI應用的,開發(fā)需要三步:給應用起名、在角色指令中描述具體要求、到工具組建中把代碼解釋器加進來,幫助運算。ModelBuilder可以根據(jù)開發(fā)者的需求定制任意尺寸的模型,并根據(jù)細分場景對模型進一步精調SFT。

演示這個功能時,李彥宏向小度詢問了一系列問題,包括新聞、日程安排等,“看起來是跟同一個在交流,其實背后調用了不同的模型”,有的是文心大模型4.0,有的是基于ERNIE Lite的精調模型。

看不上開源

“我們可以根據(jù)需要,兼顧效果、響應速度、推理成本等各種考慮,裁剪出適合各種場景的更小尺寸模型,并且支持精調和post pretrain(一種預訓練模型的遷移學習方法)。這樣通過降維裁剪出來的模型,比直接拿開源調出來的模型,同等尺寸下,效果明顯更好,同等效果下,成本明顯更低!崩顝┖赀M一步說,“大家以前用開源覺得便宜,其實在大模型場景下,開源是最貴的。所以開源模型會越來越落后!

這不是他第一次吐槽開源大模型。據(jù)報道,李彥宏近日在內部講話中表示,大模型閉源是有真正的商業(yè)模式的,是能夠賺到錢的,最終才能聚集算力、聚集人才。

巧合的是,本月阿里云通義千問披露了最新開源(20.600, 0.00, 0.00%)進展,開源320億參數(shù)模型Qwen1.5-32B,此前已開源5億、18億、40億、70億、140億和720億參數(shù)6款大語言模型。阿里云相關人士告訴北京商報記者,上述大模型均已升級至1.5版本。此次開源的320億參數(shù)模型相比通義千問14B開源模型,在智能體場景下能力更強,相比通義千問72B開源模型,推理成本更低。

李彥宏也強調了成本,“通過這種大小模型的組合調度方式,小度完成了‘換腦行動’,裝上AI原生操作系統(tǒng)DuerOS X,相比全部使用文心大模型的旗艦版,響應速度提升2倍,成本下降99%”。

其實,大小模型組合不是百度獨有!敖裉旌芏嚅_源的軟件給的是百億(級別的)模型,跟ChatGPT不能比,但是在企業(yè)內部夠用的情況下,它的部署成本可以從原來的千萬美元降到千萬元甚至百萬元的級別。我覺得,這就真正達到了‘把大模型拉下神壇’的目標!360創(chuàng)始人周鴻祎在2023年8月說。

認知和落地

另一個總會占據(jù)百度Create大會不小篇幅的業(yè)務是出行。李彥宏是在談及多模態(tài)大模型上提到駕駛的。在他看來,“多模態(tài)大模型,或者說文字、圖片、語音、視頻等多模態(tài)的融合,是基礎模型非常重要的長期發(fā)展方向,是通往AGI(人工通用智能)的必經(jīng)之路。視覺大模型最大的應用場景是自動駕駛”。

“李彥宏的認知沒有問題,但認知正確不代表能順利落地,”文淵智庫創(chuàng)始人王超告訴北京商報記者,“百度在人工智能的積累和開局不錯,但目前大規(guī)模商業(yè)化的能力欠缺!

2023年百度營收1345.98億元,較2022年增長9%,非公認會計準則下凈利潤287億元,較2022年增長39%。根據(jù)百度電話會議透露的信息,受益于通用人工智能和基礎模型,百度2023年四季度云業(yè)務產生6.56億元收入,這個數(shù)字在2024年全年將增長到數(shù)十億元。

換一個角度看數(shù)據(jù)。2023年12月百度App月活6.67億,該數(shù)字在2023年6月是6.77億。

來自QuestMobile的數(shù)據(jù)顯示,在AIGC(人工智能生成內容)領域,2024年1月,抖音的豆包、百度的文心一言、昆侖萬維(39.740, 0.00, 0.00%)的天工是國內月活躍用戶規(guī)模排名前三的App,當月月活分別是1756.9萬、1212.5萬、801.4萬。用戶超2億,那月活數(shù)據(jù)呢?北京商報記者就文心一言用戶數(shù)據(jù)采訪百度相關人士,其表示“未對外公布”。

編 輯:馬秋月
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構成任何投資及應用建議。如網(wǎng)站內容涉及作品版權和其它問題,請在30日內與本網(wǎng)聯(lián)系,我們將在第一時間刪除內容。本站聯(lián)系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內容核實”、“商務聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
相關新聞              
 
人物
陳忠岳:中國聯(lián)通正在開展6G技術指標制定等工作
精彩專題
CES 2024國際消費電子展
2023年信息通信產業(yè)盤點暨頒獎禮
飛象網(wǎng)2023年手機評選
第24屆中國國際光電博覽會
CCTIME推薦
關于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業(yè)務經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉載、摘編、復制、鏡像