被稱為“價格屠夫”的DeepSeek再次揮刀降價了。
9月29日晚間,DeepSeek宣布正式發(fā)布 DeepSeek-V3.2-Exp模型,性能仍是穩(wěn)步提升,但出乎意料的是,調(diào)用價格大幅降低,尤其輸出價格大降75%,業(yè)界人士表示“這很難卷得過”。DeepSeek提到,在新價格政策下,開發(fā)者調(diào)用DeepSeek API的成本將降低50%以上。
具體來看,輸入價格上,緩存命中時,DeepSeek-V3.2-Exp從0.5元/百萬tokens降至0.2元/百萬tokens,緩存未命中的價格則從4元/百萬tokens降為2元/百萬tokens;輸出價格上,從12元/百萬tokens直接降到了3元/百萬tokens。
降價原因方面,DeepSeek介紹是得益于新模型服務(wù)成本的大幅降低。V3.2-Exp是一個實驗性(Experimental)的版本,作為邁向新一代架構(gòu)的中間步驟,在 V3.1-Terminus 的基礎(chǔ)上這一模型引入了 DeepSeek Sparse Attention(一種稀疏注意力機(jī)制),針對長文本的訓(xùn)練和推理效率進(jìn)行了探索性的優(yōu)化和驗證。
簡單來說,因為實現(xiàn)了細(xì)粒度稀疏注意力機(jī)制,在幾乎不影響模型輸出效果的前提下,可以實現(xiàn)長文本訓(xùn)練和推理效率的大幅提升。
DeepSeek介紹,為了嚴(yán)謹(jǐn)?shù)卦u估引入稀疏注意力帶來的影響,團(tuán)隊將 DeepSeek-V3.2-Exp 的訓(xùn)練設(shè)置與 V3.1-Terminus 進(jìn)行了嚴(yán)格的對齊。在各領(lǐng)域的公開評測集上,DeepSeek-V3.2-Exp 的表現(xiàn)與 V3.1-Terminus 基本持平。
目前,DeepSeek-V3.2-Exp 模型已在Huggingface與魔搭開源,官方App、網(wǎng)頁端、小程序均已同步更新為DeepSeek-V3.2-Exp。API 的模型版本已經(jīng)更新為 DeepSeek-V3.2-Exp,訪問方式保持不變。
此外,為支持社區(qū)研究,DeepSeek 還開源了新模型研究中設(shè)計和實現(xiàn)的 GPU 算子,包括 TileLang 和 CUDA 兩種版本。團(tuán)隊建議社區(qū)在進(jìn)行研究性實驗時,優(yōu)先使用基于 TileLang 的版本,以便于調(diào)試和快速迭代。
值得一提的是,就在9月22日,DeepSeek才發(fā)布了DeepSeek-V3.1-Terminus模型,Terminus在拉丁語里是終點、界限的意思,當(dāng)時業(yè)界猜測這是否會是V3系列的終極版本,并期待下一個發(fā)布的將是大版本更新,目前看起來這個猜測并不成立。
在年初海內(nèi)外出圈后,DeepSeek每一次更新都成為業(yè)界矚目的焦點,但這幾個月以來DeepSeek幾次更新都是小版本的迭代,關(guān)于V4和R2的呼聲也越來越多。在DeepSeek這次 X平臺上的官宣帖子下,就有海外網(wǎng)友詢問“什么時候可以期待下一個V4和R2的版本”,很快有網(wǎng)友回復(fù)表示,結(jié)合這次發(fā)布來看近期并不會看到。