阿里千問3發(fā)布并開源，參數(shù)僅為DeepSeek-R1三分之一

2025年4月29日 08:43 新浪科技

4月29日上午消息，阿里巴巴開源了新一代通義千問模型Qwen3（簡稱千問3），參數(shù)量僅為DeepSeek-R1的1/3，宣布成本大幅下降，性能超越R1、OpenAI-o1等領(lǐng)先模型。千問3是一個“混合推理模型”，將“快思考”與“慢思考”集成進同一個模型，極大節(jié)省了算力消耗。

據(jù)了解，千問3采用混合專家（MoE）架構(gòu)，總參數(shù)量235B，激活僅需22B。千問3預(yù)訓(xùn)練數(shù)據(jù)量達(dá)36T tokens，并在后訓(xùn)練階段經(jīng)過多輪強化學(xué)習(xí)，將非思考模式無縫整合到思考模型中。千問3在推理、指令遵循、工具調(diào)用、多語言能力等方面均大幅增強。性能大幅提升的同時，千問3的部署成本還大幅下降，僅需4張H20即可部署千問3滿血版，顯存占用僅為性能相近模型的三分之一。（文猛）

編輯：路金娣

飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容，凡注明來源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有，未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像，違者必究。對于經(jīng)過授權(quán)可以轉(zhuǎn)載，請必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性，并完整標(biāo)注作者信息和飛象網(wǎng)來源。
2.凡注明“來源：XXXX”的作品，均轉(zhuǎn)載自其它媒體，在于傳播更多行業(yè)信息，并不代表本網(wǎng)贊同其觀點和對其真實性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問題，請在相關(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系，我們將第一時間予以處理。
本站聯(lián)系電話為86-010-87765777，郵件后綴為cctime.com，冒充本站員工以任何其他聯(lián)系方式，進行的“內(nèi)容核實”、“商務(wù)聯(lián)系”等行為，均不能代表本站。本站擁有對此聲明的最終解釋權(quán)。

推薦新聞

·打破信息繭房、避免大數(shù)據(jù)殺熟，平臺算法從“黑箱”走..	·4K電視頻道時代來了！廣電總局推出超高清標(biāo)準(zhǔn)信號圖
·把“未來”端上來！中國移動本屆數(shù)字峰會創(chuàng)新科技搶“..	·新質(zhì)生產(chǎn)力加快形成
·國家數(shù)據(jù)發(fā)展研究院正式揭牌	·工信部公開征集對3項強制性國家標(biāo)準(zhǔn)制修訂計劃項目的意見
·電子信息制造業(yè)為何一馬當(dāng)先	·我國已形成完整人工智能產(chǎn)業(yè)體系，專利申請量位居全球首位
·“每天下線一顆星” 商業(yè)衛(wèi)星制造提速數(shù)據(jù)潛能如何解鎖	·雷軍：十年后小米手機重回中國第一！無比感慨
·工信部通報52款侵害用戶權(quán)益行為APP（SDK）	·中興通訊發(fā)布創(chuàng)新與知識產(chǎn)權(quán)白皮書：以高質(zhì)量專利護航..
·中國聯(lián)通“領(lǐng)跑行動”啟動科技賦能馬拉松新體驗	·“第八屆數(shù)字中國建設(shè)峰會·智能云生態(tài)大會”即將開幕