每日微信報(bào)
人物專訪監(jiān)管
制造芯片
6G 運(yùn)營(yíng)
大數(shù)據(jù)物聯(lián)網(wǎng)
移動(dòng)互聯(lián)網(wǎng)量子
云計(jì)算互聯(lián)網(wǎng)
報(bào)告衛(wèi)星

“價(jià)格屠夫”DeepSeek上線，新模型成本下降超50%

2025年9月30日 07:14第一財(cái)經(jīng)

被稱為“價(jià)格屠夫”的DeepSeek再次揮刀降價(jià)了。

9月29日晚間，DeepSeek宣布正式發(fā)布 DeepSeek-V3.2-Exp模型，性能仍是穩(wěn)步提升，但出乎意料的是，調(diào)用價(jià)格大幅降低，尤其輸出價(jià)格大降75%，業(yè)界人士表示“這很難卷得過(guò)”。DeepSeek提到，在新價(jià)格政策下，開發(fā)者調(diào)用DeepSeek API的成本將降低50%以上。

具體來(lái)看，輸入價(jià)格上，緩存命中時(shí)，DeepSeek-V3.2-Exp從0.5元/百萬(wàn)tokens降至0.2元/百萬(wàn)tokens，緩存未命中的價(jià)格則從4元/百萬(wàn)tokens降為2元/百萬(wàn)tokens；輸出價(jià)格上，從12元/百萬(wàn)tokens直接降到了3元/百萬(wàn)tokens。

降價(jià)原因方面，DeepSeek介紹是得益于新模型服務(wù)成本的大幅降低。V3.2-Exp是一個(gè)實(shí)驗(yàn)性（Experimental）的版本，作為邁向新一代架構(gòu)的中間步驟，在 V3.1-Terminus 的基礎(chǔ)上這一模型引入了 DeepSeek Sparse Attention（一種稀疏注意力機(jī)制），針對(duì)長(zhǎng)文本的訓(xùn)練和推理效率進(jìn)行了探索性的優(yōu)化和驗(yàn)證。

簡(jiǎn)單來(lái)說(shuō)，因?yàn)閷?shí)現(xiàn)了細(xì)粒度稀疏注意力機(jī)制，在幾乎不影響模型輸出效果的前提下，可以實(shí)現(xiàn)長(zhǎng)文本訓(xùn)練和推理效率的大幅提升。

DeepSeek介紹，為了嚴(yán)謹(jǐn)?shù)卦u(píng)估引入稀疏注意力帶來(lái)的影響，團(tuán)隊(duì)將 DeepSeek-V3.2-Exp 的訓(xùn)練設(shè)置與 V3.1-Terminus 進(jìn)行了嚴(yán)格的對(duì)齊。在各領(lǐng)域的公開評(píng)測(cè)集上，DeepSeek-V3.2-Exp 的表現(xiàn)與 V3.1-Terminus 基本持平。

目前，DeepSeek-V3.2-Exp 模型已在Huggingface與魔搭開源，官方App、網(wǎng)頁(yè)端、小程序均已同步更新為DeepSeek-V3.2-Exp。API 的模型版本已經(jīng)更新為 DeepSeek-V3.2-Exp，訪問(wèn)方式保持不變。

此外，為支持社區(qū)研究，DeepSeek 還開源了新模型研究中設(shè)計(jì)和實(shí)現(xiàn)的 GPU 算子，包括 TileLang 和 CUDA 兩種版本。團(tuán)隊(duì)建議社區(qū)在進(jìn)行研究性實(shí)驗(yàn)時(shí)，優(yōu)先使用基于 TileLang 的版本，以便于調(diào)試和快速迭代。

值得一提的是，就在9月22日，DeepSeek才發(fā)布了DeepSeek-V3.1-Terminus模型，Terminus在拉丁語(yǔ)里是終點(diǎn)、界限的意思，當(dāng)時(shí)業(yè)界猜測(cè)這是否會(huì)是V3系列的終極版本，并期待下一個(gè)發(fā)布的將是大版本更新，目前看起來(lái)這個(gè)猜測(cè)并不成立。

在年初海內(nèi)外出圈后，DeepSeek每一次更新都成為業(yè)界矚目的焦點(diǎn)，但這幾個(gè)月以來(lái)DeepSeek幾次更新都是小版本的迭代，關(guān)于V4和R2的呼聲也越來(lái)越多。在DeepSeek這次 X平臺(tái)上的官宣帖子下，就有海外網(wǎng)友詢問(wèn)“什么時(shí)候可以期待下一個(gè)V4和R2的版本”，很快有網(wǎng)友回復(fù)表示，結(jié)合這次發(fā)布來(lái)看近期并不會(huì)看到。

編輯：高靖宇

飛象網(wǎng)版權(quán)及免責(zé)聲明:
1.本網(wǎng)刊載內(nèi)容，凡注明來(lái)源為“飛象網(wǎng)”和“飛象原創(chuàng)”皆屬飛象網(wǎng)版權(quán)所有，未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像，違者必究。對(duì)于經(jīng)過(guò)授權(quán)可以轉(zhuǎn)載，請(qǐng)必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性，并完整標(biāo)注作者信息和飛象網(wǎng)來(lái)源。
2.凡注明“來(lái)源：XXXX”的作品，均轉(zhuǎn)載自其它媒體，在于傳播更多行業(yè)信息，并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
3.如因作品內(nèi)容、版權(quán)和其它問(wèn)題，請(qǐng)?jiān)谙嚓P(guān)作品刊發(fā)之日起30日內(nèi)與本網(wǎng)聯(lián)系，我們將第一時(shí)間予以處理。
本站聯(lián)系電話為86-010-87765777，郵件后綴為cctime.com，冒充本站員工以任何其他聯(lián)系方式，進(jìn)行的“內(nèi)容核實(shí)”、“商務(wù)聯(lián)系”等行為，均不能代表本站。本站擁有對(duì)此聲明的最終解釋權(quán)。