首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數(shù)據(jù)|物聯(lián)網(wǎng)|量子|元宇宙|博客|特約記者
手機|互聯(lián)網(wǎng)|IT|5G|光通信|人工智能|云計算|芯片報告|智慧城市|移動互聯(lián)網(wǎng)|會展
首頁 >> 頭條資訊 >> 正文

百度:大模型數(shù)量國內(nèi)第一!全面升級!

2023年8月7日 07:30  百度  

日前,百度智能云方面表示,千帆大模型平臺已完成新一輪升級,重點升級了兩大功能。

據(jù)了解,目前千帆大模型平臺已經(jīng)全面接入Llama 2全系列、ChatGLM2-6B、RWKV-4-World、MPT-7B-Instruct、Falcon-7B等33個大模型,成為國內(nèi)擁有大模型最多的平臺。接入的模型經(jīng)過千帆平臺二次性能增強,模型推理成本最高可降低50%。同時,千帆平臺上線了國內(nèi)最全的預(yù)置Prompt模板,模板數(shù)量多達103個,覆蓋對話、游戲、編程、寫作十余個場景。

2023年3月,百度智能云推出“千帆大模型平臺”,它是全球首個一站式的企業(yè)級大模型平臺,不但提供包括文心一言在內(nèi)的大模型服務(wù)及第三方大模型服務(wù),還提供大模型開發(fā)和應(yīng)用的整套工具鏈,能夠幫助企業(yè)解決大模型開發(fā)和應(yīng)用過程中的所有問題。

百度智能云方面表示,本次千帆大模型平臺升級的目的是給企業(yè)、開發(fā)者提供更加靈活、多樣化、高效的大模型服務(wù),客戶可選擇最適合自身業(yè)務(wù)的大模型,再利用千帆平臺全套工具鏈進行模型再訓(xùn)練、指令微調(diào)等,高效率、低成本地打造企業(yè)專屬大模型。此外,海量Prompt模板庫可提高大模型內(nèi)容準確性和滿意度。

千帆接入Llama 2等33個優(yōu)質(zhì)模型,推理成本最高可降低50%

當(dāng)前,開源大模型生態(tài)發(fā)展迅速,大量優(yōu)質(zhì)模型涌現(xiàn),在不同任務(wù)場景、參數(shù)量級與算力環(huán)境下體現(xiàn)出了差異化優(yōu)勢。如何選擇適合的大模型、如何應(yīng)用大模型能力提升市場競爭力,成為越來越多企業(yè)迫切探索的方向。

文心大模型是百度發(fā)布的產(chǎn)業(yè)級知識增強大模型,據(jù)IDC 最新發(fā)布的《AI 大模型技術(shù)能力評估報告,2023》顯示,文心大模型得到“綜合評分第一,算法模型第一,行業(yè)覆蓋第一”三個絕對第一。在文心大模型3.5版支持下的文心一言,中文能力突出,在多個公開測評也顯示有超出 GPT-4 的表現(xiàn)。

為了滿足企業(yè)對大模型多樣的需求,千帆大模型平臺以文心大模型為核心,同時全面接入Llama 2全系列、ChatGLM2-6B、RWKV-4-World、MPT-7B-Instruct、Falcon-7B等33個大模型,成為國內(nèi)擁有大模型最多的平臺。

企業(yè)用戶可將不同大模型搭配使用,以滿足不同細分場景的業(yè)務(wù)需求。企業(yè)和開發(fā)者可以登陸千帆大模型平臺操作臺,在“模型倉庫”中直接調(diào)用、部署。

據(jù)了解,千帆平臺接入的大模型均經(jīng)過嚴格優(yōu)選,主要考核三大指標:模型效果、模型安全性、可商用。為給企業(yè)客戶帶來更好的模型產(chǎn)品,千帆對這33個大模型進行了性能+安全的雙重增強。

一方面,千帆每一個大模型進行了二次性能增強。通過優(yōu)化模型吞吐、降低模型尺寸,實現(xiàn)模型推理速度的大幅提升。據(jù)測算,調(diào)優(yōu)后模型體積可壓縮至25%-50%,推理性能顯著提升。這意味著,企業(yè)在千帆上調(diào)用這些模型可極大地節(jié)約成本,提升效果。

另一方面,千帆對第三方大模型做了二次安全增強,更好管控模型輸出的安全性?蛻粼谇Х险{(diào)用第三方模型,也享有平臺的安全保障。

值得一提的是,為方便開發(fā)者和企業(yè)做模型調(diào)優(yōu),千帆還提供多種低門檻調(diào)優(yōu)工具,包括SFT(全量參數(shù)微調(diào)、Prompt Tuning、LoRA)及強化學(xué)習(xí)(獎勵模型學(xué)習(xí)、強化學(xué)習(xí)訓(xùn)練)等,同一模型可通過多種方式持續(xù)調(diào)優(yōu)。此外,千帆還支持數(shù)據(jù)回流功能,可在實際生產(chǎn)過程中持續(xù)微調(diào),提升模型效果。

上線國內(nèi)最全Prompt海量模板庫,大幅優(yōu)化模型輸出效果

Prompt是指通過自然語言向大模型提出問題/提示,幫助大模型更好的理解人類的問題。實際應(yīng)用時,大模型往往因為Prompt缺乏針對性、描述不清晰等原因影響到內(nèi)容準確性。

為幫助客戶提高Prompt提問質(zhì)量、提升模型輸出滿意度,本輪升級后,百度智能云千帆大模型平臺上線了海量預(yù)置Prompt模板庫,模板數(shù)量多達103個,包含對話、編程、電商、醫(yī)療、游戲、翻譯、演講等十余個常見場景。用戶可以根據(jù)需求選擇合適的模板,直接輸出給大模型, 即可提高模型內(nèi)容的針對性和準確度。

百度智能云表示,很多企業(yè)使用大模型時,認為效果不好是模型本身的問題,其實很多時候重新編寫Prompt就能達到預(yù)想的效果。海量Prompt模板的推出,大幅降低了Prompt撰寫難度。很多情況下,企業(yè)無需花費大量資源調(diào)優(yōu)大模型,基于模板優(yōu)化Prompt,即可得到滿意的模型效果。

如今,大模型正在重塑各行各業(yè),進入產(chǎn)業(yè)落地期。為降低大模型使用門檻,千帆大模型平臺將持續(xù)匯聚優(yōu)質(zhì)的大模型資源,提供易用可靠的大模型工具鏈,幫助每個企業(yè)、開發(fā)者打通擁抱大模型的最短路徑,共同探索大模型與行業(yè)結(jié)合的創(chuàng)新實踐。

編 輯:高靖宇
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構(gòu)成任何投資及應(yīng)用建議。如網(wǎng)站內(nèi)容涉及作品版權(quán)和其它問題,請在30日內(nèi)與本網(wǎng)聯(lián)系,我們將在第一時間刪除內(nèi)容。本站聯(lián)系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯(lián)系方式,進行的“內(nèi)容核實”、“商務(wù)聯(lián)系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。
相關(guān)新聞              
 
人物
工信部張云明:大部分國家新劃分了中頻段6G頻譜資源
精彩專題
專題丨“汛”速出動 共筑信息保障堤壩
2023MWC上海世界移動通信大會
中國5G商用四周年
2023年中國國際信息通信展覽會
CCTIME推薦
關(guān)于我們 | 廣告報價 | 聯(lián)系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網(wǎng) CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證080234號 京公網(wǎng)安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經(jīng)書面許可,禁止轉(zhuǎn)載、摘編、復(fù)制、鏡像