飛象原創(chuàng)(高靖宇/文)站在2024年的技術十字路口,AI正在全面改造手機行業(yè),無論是在功能創(chuàng)新還是用戶體驗上,AI驅動的手機都讓人眼前一亮。從硬件升級到智能化的深度融合,手機廠商都在加速擁抱AI。
對于手機廠商來說,AI不僅僅是“能做什么”,而是“能為你做什么”,如何讓AI“更懂你”,利用AI實現(xiàn)更高效的用戶體驗,這正是驅動AI手機未來發(fā)展的核心意義所在。
10月10日,2024 vivo開發(fā)者大會上,vivo正式發(fā)布“藍心智能”AI戰(zhàn)略,其中PhoneGPT(即“手機智能體”),是vivo基于藍心大模型技術做出的一次全新探索。而從“智能”到“智能體”這一字之差的變化,標志著AI手機進入到一個全新的個人智能體時代。
PhoneGPT:AI手機的全新蛻變
回想AI與手機的初遇,還是在Siri、Google Assistant等語音助手的出現(xiàn),讓人們第一次感受到了“智能”的觸手可及。用戶可以通過簡單的語音命令讓手機完成任務,例如查詢天氣、設定提醒或是發(fā)短信。然而,這類助手的局限性很快顯現(xiàn):它們大多只能基于關鍵詞作出反應,無法真正理解用戶的意圖。你問,它答,流程機械而僵化,遠不能稱之為“智能”。
大模型的應用使得手機AI能力有了革命性的提升,“AI手機”已經(jīng)是完全不同的概念,AI技術在語音識別、圖像識別、智能推薦等方面更是取得了長足進步,給用戶帶來了全新的使用體驗。
不過,AI手機依然沒有擺脫“你問我答”的模式,也就是用戶必須清晰地表達命令,手機才能作出反應,遠未達到“懂你”的地步。而vivo發(fā)布的PhoneGPT,具備自主拆解需求、主動規(guī)劃路徑、實時環(huán)境識別、動態(tài)反饋決策等能力?梢院唵蔚睦斫鉃,手機AI能力不再停留在單一功能層面,而是以“智能體”的形式具備了完整“思考”用戶需求的能力。
據(jù)vivo副總裁周圍介紹,PhoneGPT已可以準確識別手機屏幕界面中的內容,并自主操作手機的電話、短信等各類應用程序,完成用戶交代的任務。
在演示中,藍心小V不僅可以對屏幕界面進行識別和操作,也可以通過接管音頻進行自主對話,以完成用戶交代的任務,例如幫助我們去訂餐廳、訂咖啡等等。
“這是手機自動化的一小步,卻是解放用戶雙手的一大步!敝車Q,未來PhoneGPT會帶來更多的應用場景,更好的智能體驗,讓小V成為更懂你的私人助理。
藍心智能:用AI重構系統(tǒng)體驗
PhoneGPT背后,是來自于vivo全新的AI戰(zhàn)略——藍心智能。藍心智能是將大模型技術與手機操作系統(tǒng)深度融合的個人智能。周圍解釋,以藍心大模型為技術底座,藍心智能可以理解用戶的個人情景和偏好,為用戶提供個人化的專屬服務; 同時,藍心智能將全方位守護用戶的隱私安全; 通過系統(tǒng)深度融合,為用戶持續(xù)構建更自然、符合直覺的交互,帶來更智能溫暖的體驗。
為了達成這一點,vivo從三個方面用AI重構了系統(tǒng)體驗。首先是重構人與設備的交互體驗,讓交互更自然更符合直覺。在藍心大模型的加持下,手機將具備更強大的分析能力,多模態(tài)大模型都可以深度解讀你的意圖,進而給你需要的反饋和服務。而依托文本大模型,讓藍心小V在文本能力外,進一步具備強大的語音表征理解與生成能力,進而讓手機能夠與人自然對話、翻譯語言、模擬人聲甚至理解對話中的情緒。
第二個方面是重構人與數(shù)字世界的服務體驗,讓智能更加個人化,也就是構建簡單高效的服務獲取能力和主動服務能力,讓人找服務的同時,服務也主動匹配人的需求。
第三個方面是重構人與物理世界的連接體驗,讓溝通更順暢和溫暖。去年,vivo讀譜功能的發(fā)布,讓喜愛音樂的視障人士可以利用手機學習樂譜和樂器。而今,vivo利用多模態(tài)大模型,讓手機成為視障人士的眼睛,幫助他們跨越溝通的鴻溝。
藍心大模型矩陣:全面升級大模型能力
為進一步夯實AI能力底座,vivo在今年的開發(fā)者大會上發(fā)布了全新自研藍心大模型矩陣。全面升級語言大模型和端側大模型能力,并帶來vivo自研的語音大模型、圖像大模型以及多模態(tài)大模型。這預示藍心智能,向著個人化和多元化發(fā)展邁出重要的一步。
在語言大模型上,千億級藍心云端大模型,重點優(yōu)化了意圖理解與分發(fā)和任務規(guī)劃能力。相比去年,整體能力提升30%,在SuperCLUE和C-EVAL榜單上繼續(xù)領跑國內第一梯隊。
用戶的隱私安全始終是vivo打造藍心智能的首要原則,繼去年帶來了三款端側大模型之后,vivo正式發(fā)布全新30億參數(shù)量級的藍心端側大模型3B。在對話寫作、摘要總結、信息抽取等能力上,藍心3B可以越級比肩行業(yè)7B-9B模型。相比藍心7B,藍心 3B極致性能提升300%,平衡模式下功耗優(yōu)化達46%,極致出詞速度可以達到80字/s,系統(tǒng)功耗僅450mA,內存占用僅1.4GB。在SuperCLUE和Equal Eval的小模型綜合能力評測中,藍心3B均排名第一,同時獲得了泰爾實驗室端側大模型綜合能力認證以及AIIA安全防范能力認證。
除此之外,vivo還同步帶來了可以準確理解自然語義,模擬人聲的全新自研藍心語音大模型、強化中國特色與東方美學的融合生成能力的藍心圖像大模型以及升級視覺感知理解能力的藍心多模態(tài)大模型。
周圍表示,藍心智能將以藍心大模型矩陣為技術底座,繼續(xù)探索AI與OS的深度融合,持續(xù)打造開放共贏的智能體生態(tài)。
未來已來,AI手機正在改變我們與世界的連接方式,你準備好迎接PhoneGPT時代了嗎?