123,123

2023年密集升級(jí)后，國(guó)內(nèi)大廠大模型的迭代節(jié)奏轉(zhuǎn)為小步快跑。5月9日，阿里云CTO周靖人揭開(kāi)了最新版大模型通義千問(wèn)2.5的面紗，并系統(tǒng)性披露了阿里云AI應(yīng)用的一系列新進(jìn)展。

站在C（用戶(hù)）端角度，抖音旗下AIGC應(yīng)用豆包的月活用戶(hù)排名第一，且數(shù)據(jù)已拉開(kāi)差距。B端競(jìng)爭(zhēng)更加劍拔弩張，閉源開(kāi)源孰優(yōu)孰劣的背后是大模型技術(shù)、成本、商業(yè)化、生態(tài)的比拼，阿里云用1100億參數(shù)的開(kāi)源大模型證明自己的誠(chéng)意，3%的營(yíng)收同比增幅也實(shí)實(shí)在在地反映了阿里云的瓶頸。

新版本

和上線通義千問(wèn)2.1版本相比，阿里云這次公布2.5版本要高調(diào)得多�！斑@個(gè)版本代表了全方位的能力提升”，周靖人用理解能力、邏輯推理、指令遵循、代碼能力舉例，2.5版本較2.1版本分別提升9%、16%、19%、10%。

將時(shí)間拉長(zhǎng)，2023年4月通義大模型啟動(dòng)邀請(qǐng)測(cè)試，一年間行業(yè)發(fā)生的變化讓從業(yè)者都倍感驚訝。

在周靖人看來(lái)，目前整個(gè)技術(shù)體系的發(fā)展在一個(gè)快速上升的渠道，不過(guò)目前市面上的大模型工具都還有提升空間。

為了證明自己的大模型能力，阿里云和同行的操作一致——援引評(píng)測(cè)結(jié)果：在權(quán)威基準(zhǔn)OpenCompass上，通義千問(wèn)2.5得分追平GPT-4 Turbo；通義千問(wèn)視覺(jué)理解模型Qwen-VL-Max在多個(gè)多模態(tài)標(biāo)準(zhǔn)測(cè)試中超越Gemini Ultra和GPT-4V，目前已在多家企業(yè)落地應(yīng)用；通義千問(wèn)代碼大模型CodeQwen1.5-7B則是HuggingFace代碼模型榜單Big Code的頭名選手，是智能編碼助手通義靈碼的底座。

按照通義千問(wèn)官網(wǎng)的歸納，其基于大模型的服務(wù)共有10項(xiàng)，包括大模型服務(wù)平臺(tái)阿里云百煉、AI閱讀助手通義智文、剛發(fā)布企業(yè)版的通義靈碼等。企業(yè)客戶(hù)和開(kāi)發(fā)者可以通過(guò)API（應(yīng)用程序編程接口）調(diào)用、模型下載等方式接入通義，個(gè)人用戶(hù)可從通義App、官網(wǎng)和小程序免費(fèi)使用通義家族全棧服務(wù)。

N合一

這些垂直領(lǐng)域的產(chǎn)品也在不斷調(diào)整。5月9日，“通義千問(wèn)App”更名為“通義App”。升級(jí)前，通義App設(shè)有三個(gè)入口：對(duì)話(huà)、智能體、頻道，升級(jí)后變?yōu)橹�、工具、角色、頻道。2024年通義推出的“全民舞王”“全民唱演”“通義照相館”等應(yīng)用在頻道一欄。

兩個(gè)月前，通義聽(tīng)悟工程研發(fā)負(fù)責(zé)人邢君就向北京商報(bào)記者透露了通義聽(tīng)悟集成進(jìn)通義App的計(jì)劃。5月9日，阿里云相關(guān)人告訴北京商報(bào)記者，“目前，包括通義聽(tīng)悟、智文等通義家族產(chǎn)品能力已集成到通義App中”。

根據(jù)蘋(píng)果應(yīng)用商店數(shù)據(jù)，通義在免費(fèi)效率榜單排在第13位，同類(lèi)的大模型產(chǎn)品還包括豆包、文心一言、訊飛星火、智譜清言、天工、kimi等。

第三方商業(yè)智能數(shù)據(jù)服務(wù)商QuestMobile發(fā)布的最新數(shù)據(jù)顯示，AIGC獨(dú)立App用戶(hù)量超7380萬(wàn)，同比增長(zhǎng)8倍。2024年3月，豆包、文心一言、天工、訊飛星火、Kimi的月活用戶(hù)分別是2328.2萬(wàn)、1466.1萬(wàn)、966.1萬(wàn)、620.4萬(wàn)、589.7萬(wàn)。

這一排名等同于國(guó)內(nèi)大模型的能力嗎？文淵智庫(kù)創(chuàng)始人王超的答案是否定的，他告訴北京商報(bào)記者，“還是要以用戶(hù)的使用感受為第一，而不是月活規(guī)模。我個(gè)人的排名是Gemini免費(fèi)版、GPT3.5和Kimi差不多、通義千問(wèn)、文心一言”。

除獨(dú)立App外，小程序也是大模型接觸用戶(hù)的主要渠道。根據(jù)QuestMobile提供的Kimi和訊飛星火的數(shù)據(jù)，2024年3月Kimi微信小程序月活用戶(hù)91.1萬(wàn)，訊飛星火去重總用戶(hù)規(guī)模635.6萬(wàn)。

繼續(xù)開(kāi)源

“用戶(hù)活躍度能一定程度上反映大模型產(chǎn)品的市場(chǎng)格局。受到用戶(hù)屬性、產(chǎn)品體量和活躍度影響，目前豆包和文心一言的用戶(hù)量級(jí)明顯較高，但從產(chǎn)品功能來(lái)看，kimi的使用場(chǎng)景更為垂直，這意味著kimi近600萬(wàn)的活躍用戶(hù)黏性更高，用戶(hù)的忠誠(chéng)度和未來(lái)的運(yùn)營(yíng)空間也會(huì)更大�！比疬_(dá)恒研究院經(jīng)理王清霖告訴北京商報(bào)記者，“通義這類(lèi)大模型產(chǎn)品也可以結(jié)合阿里自身的產(chǎn)品屬性?xún)?yōu)勢(shì)，找到自己的發(fā)展方向和黏性用戶(hù)�！�

開(kāi)源閉源的優(yōu)劣則是行業(yè)觀察者聚焦的重點(diǎn)。4月，百度CEO李彥宏公開(kāi)表示，“大家以前用開(kāi)源覺(jué)得便宜，其實(shí)在大模型場(chǎng)景下，開(kāi)源是最貴的。所以開(kāi)源模型會(huì)越來(lái)越落后”。5月9日，周靖人接受媒體采訪時(shí)回答的第一個(gè)問(wèn)題也與此有關(guān)�！伴_(kāi)源對(duì)整個(gè)技術(shù)發(fā)展的意義大家都可以看到。阿里云自己做最先進(jìn)的AI模型，也敢于開(kāi)源，這對(duì)企業(yè)真正做創(chuàng)新性開(kāi)發(fā)將起到至關(guān)重要的作用，這一點(diǎn)在全球范圍已經(jīng)被多次證明，沒(méi)有再討論的必要。”

“坦率地說(shuō)，不是所有的閉源公司的模型都能做得過(guò)開(kāi)源模型，首先閉源公司的模型水平要超過(guò)開(kāi)源模型的水準(zhǔn)。”周靖人補(bǔ)充。

當(dāng)天，阿里云發(fā)布了最新款開(kāi)源模型1100億參數(shù)的Qwen1.5-110B，此前5億、18億、40億、70億、140億、320億和720億參數(shù)的大模型已經(jīng)開(kāi)源。

談到最近大火的長(zhǎng)文本處理能力，周靖人強(qiáng)調(diào)了兩點(diǎn)，支持、先發(fā)，“我們的長(zhǎng)文本處理功能其實(shí)是先于行業(yè)所有公司的，通義App單次可處理多達(dá)1000萬(wàn)字的長(zhǎng)文檔，還能同時(shí)解析100份不同格式的文檔。長(zhǎng)文本處理能力不光要看文本的長(zhǎng)度，還要基于場(chǎng)景做總結(jié)、歸納等，誰(shuí)的技術(shù)更強(qiáng)這種討論沒(méi)必要”。

上新大模型2.5版 阿里云緊追慢趕

上新大模型2.5版阿里云緊追慢趕