圖/IC
北京時間3月1日中午,DeepSeek于“開源周”收官之際在知乎發(fā)文,不僅解讀了關(guān)鍵的降本增效技術(shù),還首次公開了API服務(wù)的成本、收入以及理論上高達(dá)545%的利潤率。不過,這也意外引發(fā)了兩家為用戶提供DeepSeek服務(wù)的MaaS供應(yīng)商“互懟”,讓國內(nèi)AI Infra(人工智能基礎(chǔ)設(shè)施)企業(yè)罕見成為“吃瓜大戲”的主角。
MaaS,直譯為模型即服務(wù),指將模型部署到企業(yè)端提供給用戶服務(wù)。春節(jié)期間DeepSeek“服務(wù)器繁忙”時,不少從事MaaS服務(wù)的大模型基礎(chǔ)設(shè)施公司,如潞晨科技、硅基流動等為用戶提供了使用“滿血版”DeepSeek的機(jī)會。
對于該項(xiàng)服務(wù),潞晨科技創(chuàng)始人尤洋曾公開發(fā)文表示“MaaS模式下用戶越多虧損越多”,而隨著DeepSeek公開成本和利潤率,面對網(wǎng)友質(zhì)疑,尤洋發(fā)文反駁并一度“辣評”競對公司硅基流動,最終和硅基流動創(chuàng)始人袁進(jìn)輝開始“互懟”。此后,更延展到此前潞晨科技涉及的抄襲風(fēng)波上,引來了更多圈內(nèi)人士“下場”。
對此,中存算董事長陳巍評價道:“創(chuàng)業(yè)不易,創(chuàng)新不易,需要多一點(diǎn)寬容。技術(shù)上偶爾出現(xiàn)判斷偏差都很正常?!倍鴮τ诰烤笵eepSeek的MaaS服務(wù)“虧不虧”這一問題,陳巍對新京報貝殼財經(jīng)記者表示,“這個問題已經(jīng)超出純技術(shù)討論范疇了,涉及產(chǎn)品定位和AI Infra企業(yè)的求生。建議雙方擱置爭議,抓緊時間做Infra優(yōu)化,搶占用戶日活攀升的產(chǎn)業(yè)窗口期。”
DeepSeek展示盈利能力:一天收入56.2萬美元,理論成本利潤率545%
事件發(fā)生在DeepSeek的“開源周”行將結(jié)束之際——此前,DeepSeek曾表示將在從2月24日開始的“開源周”發(fā)布五項(xiàng)開源成果,但當(dāng)五項(xiàng)成果全部發(fā)布結(jié)束后的第六天,DeepSeek又發(fā)布了《DeepSeek-V3/R1推理系統(tǒng)概覽》技術(shù)文章,首次公布了模型推理系統(tǒng)降本增效的優(yōu)化細(xì)節(jié)。
該篇文章以DeepSeek推理系統(tǒng)的優(yōu)化目標(biāo):更大的吞吐,更低的延遲為核心,詳細(xì)介紹了其解決方案:使用大規(guī)模跨節(jié)點(diǎn)專家并行(Expert Parallelism / EP)。以通俗的方式來理解,就類似把AI模型拆分成多個“小專家”,分散到不同的顯卡(GPU)上運(yùn)行。就像餐館里多個廚師同時備菜,每個廚師只負(fù)責(zé)自己最擅長的部分,整體出餐速度更快。V3系統(tǒng)中,每層有256個專家,但每次只用8個,通過動態(tài)分配實(shí)現(xiàn)高效計算。
此外,當(dāng)不同顯卡之間需要傳遞數(shù)據(jù)時,系統(tǒng)會像工廠流水線一樣,讓計算和傳輸同時進(jìn)行。例如在生成文字時,前一部分還在計算,后一部分已經(jīng)開始傳輸,避免“干等”浪費(fèi)時間。
對此,袁進(jìn)輝評論道,“DeepSeek官方披露大規(guī)模部署成本和收益,又一次顛覆了很多人的認(rèn)知?,F(xiàn)在很多供應(yīng)商還做不到這個水平,主要是V3/R1架構(gòu)和其他主流模型差別太大了,由大量小Expert(專家)組成,導(dǎo)致瞄準(zhǔn)其他主流模型結(jié)構(gòu)開發(fā)的系統(tǒng)都不再有效,必須按照DeepSeek報告描述的方法才能達(dá)到最好的效率,而開發(fā)這樣的系統(tǒng)難度很高,需要時間,幸好這周DeepSeek五連發(fā)已經(jīng)把主要模塊開源出來了,降低了社區(qū)復(fù)現(xiàn)的難度?!?/p>
一個可以讓人直觀感受DeepSeek效率的數(shù)據(jù)是,其在文章最后展示了以2月27日12:00至2月28日12:00,一天內(nèi)DeepSeek V3和 R1推理服務(wù)占用的節(jié)點(diǎn),并統(tǒng)計了包括網(wǎng)頁、APP和API的所有負(fù)載,推算發(fā)現(xiàn)假定GPU租賃成本為2美元/小時,總成本為 8.7萬美元,若所消耗的tokens(算力計價單位)全部按照DeepSeek R1的API定價計算,理論上一天的總收入為56.2萬美元,成本利潤率為545%。
DeepSeek在知乎的文章中披露了其推算的成本、理論收入和利潤率 圖片來源:知乎截圖
“這份成本利潤披露看似坦誠,實(shí)則暗藏殺機(jī)。它告訴所有人:大模型的游戲規(guī)則早已變了,單靠算法或者簡單囤積算力不能贏得大模型的勝利。在算法+數(shù)據(jù)+算力的三要素中,有效算力(算力x算力效率)才是最暴力美學(xué)的生存規(guī)則,唯快不破這個道理也適用于大模型行業(yè)。這份數(shù)據(jù)事實(shí)上是三頭六臂‘大鬧東海,腳踢很白的宮’的技術(shù)演繹,也是‘算力+智力’逆風(fēng)翻盤的真實(shí)寫照?!标愇”硎?。
值得注意的是,此前DeepSeek的重要信息發(fā)布一般在X、GitHub等以英文為主的平臺,而本次的發(fā)布還額外登錄了知乎,這瞬間引發(fā)了國內(nèi)AI圈的熱情,截至3月3日早,DeepSeek發(fā)布的文章在知乎獲得了7735個贊,以及866條評論。
尤洋遭網(wǎng)友“點(diǎn)名” DeepSeek API服務(wù)到底“虧不虧”?
新京報貝殼財經(jīng)記者注意到,不少網(wǎng)友本著“看熱鬧不嫌事大”的心態(tài)在這篇文章的評論區(qū)里“呼叫尤洋”,其中一條@尤洋知乎賬號的評論獲得了475個點(diǎn)贊,點(diǎn)贊數(shù)為評論區(qū)第二高。
這是因?yàn)?,此前尤洋曾發(fā)文直言“MaaS在中國短時間內(nèi)可能是最差的商業(yè)模式”“滿血版DeepSeek R1每日輸出1000億tokens,那么每個月虧損4億”,引發(fā)了業(yè)界對MaaS商業(yè)模式的爭論。
潞晨科技創(chuàng)始人尤洋微博截圖
AI與云基礎(chǔ)設(shè)施專家左鵬飛表示,DeepSeek和尤洋之間觀點(diǎn)沖突的主要原因是對每臺H800機(jī)器能跑出多大吞吐量的認(rèn)知不同。
“根據(jù)尤洋老師的采訪視頻,4臺機(jī)器跑出的吞吐量是1K tokens/s,而DeepSeek官方跑出的數(shù)據(jù)是平均每臺機(jī)器14.8K tokens/s, 有14.8*4 ≈ 59倍的性能差距。不同MaaS服務(wù)提供商對相同機(jī)器上相同模型跑出來的吞吐量可以相差59倍,那么自然有的MaaS服務(wù)商能掙錢,有的MaaS服務(wù)商大虧錢。這也證明AI Infra的系統(tǒng)優(yōu)化能力是多么重要?!弊簌i飛說。
對于網(wǎng)友的“點(diǎn)名”,尤洋本人也發(fā)文進(jìn)行了回應(yīng),他認(rèn)為DeepSeek文章中的數(shù)據(jù)對計算MaaS成本沒有太多參考價值,因?yàn)槲恼掳袲eepSeek網(wǎng)頁,APP和MaaS API的token數(shù)加在一起計算,且數(shù)據(jù)是建立在大量用戶把DeepSeek的APP和網(wǎng)頁完全超負(fù)荷占滿的情況下,不是一個常規(guī)的MaaS。
貝殼財經(jīng)記者發(fā)現(xiàn),DeepSeek提到的545%利潤率更多指的是“理想情況”,DeepSeek在官方文章里也表示“當(dāng)然我們實(shí)際上沒有這么多收入,因?yàn)閂3的定價更低,同時收費(fèi)服務(wù)只占了一部分,另外夜間還會有折扣?!?/p>
尤洋強(qiáng)調(diào),自己對DeepSeek的模型能力沒有貶低,但其使用體驗(yàn)非常差,“我春節(jié)期間用過幾次,問一個問題,然后說繁忙,讓我稍后嘗試,我等了15分鐘或者一小時。這不是一個合格的MaaS產(chǎn)品?!?/p>
似乎為了證明自己的觀點(diǎn),尤洋在發(fā)布完回應(yīng)文章后,宣布潞晨科技將在一周后停止提供DeepSeek的API服務(wù),
潞晨科技公眾號截圖
對此,左鵬飛告訴新京報貝殼財經(jīng)記者,尤洋的觀點(diǎn)有一定的道理,但“即使考慮上資源預(yù)留,也就是545%的利潤率除以2或3,依然是盈利的,不影響我提到的核心邏輯?!?/p>
兩家MaaS供應(yīng)商開吵“嘴架” 引出抄襲“舊賬”
這一事情的發(fā)展開始逐漸“跑偏”。尤洋在回復(fù)網(wǎng)友后,又在知乎發(fā)文,矛頭直指春節(jié)期間最早開始承接DeepSeek流量,為用戶提供“滿血版DeepSeek服務(wù)”的硅基流動,認(rèn)為該公司“犧牲員工春節(jié)假期捆綁華為宣傳、在小紅書拉人頭、API速度慢”等。
對此,袁進(jìn)輝在朋友圈反擊稱“我們團(tuán)隊愿意拼搏抓一個機(jī)會有什么錯?邀請用戶送點(diǎn)免費(fèi)券有什么錯?春節(jié)那幾天,全民都想訪問DeepSeek而不得時,我們提供了僅有的一個穩(wěn)定的服務(wù)?!蓖瑫r,他還提到了此前潞晨科技曾抄襲過硅基流動。
這導(dǎo)致更多AI圈人士被牽涉進(jìn)來,如尤洋提到該起抄襲事件代碼的負(fù)責(zé)人是原潞晨科技CTO方佳瑞,但后者發(fā)長文回應(yīng)了自己的“背鍋”經(jīng)歷,表示代碼在自己入職之前就已存在。
此外,橘皮優(yōu)團(tuán)隊在2024年11月發(fā)布的對潞晨科技的公開信也被挖出,該公開信提到,“潞晨云算力云平臺公然抄襲我們的業(yè)務(wù)模式和機(jī)主協(xié)議,侵犯了知識產(chǎn)權(quán)?!痹M(jìn)輝轉(zhuǎn)發(fā)了該公開信并配文稱:“不是一次抄襲,多次發(fā)生?!?/p>
貝殼財經(jīng)記者注意到,雖然潞晨科技和硅基流動彼此指責(zé),但二者都曾和華為云合作,為用戶推出基于國產(chǎn)算力的DeepSeek服務(wù),而在DeepSeek公布開源方案之后,這些AI Infra企業(yè)能否復(fù)現(xiàn)DeepSeek的技術(shù)細(xì)節(jié),從中攤薄成本,就成了考驗(yàn)企業(yè)技術(shù)實(shí)力的時候。
值得注意的是,雖然DeepSeek在過去一周中開源了多個代碼庫,但大多數(shù)是針對英偉達(dá)芯片架構(gòu)的。對此,有開發(fā)者告訴貝殼財經(jīng)記者,這些開源成果無法直接用在華為云的推理服務(wù)中,但其思想可以借鑒。
當(dāng)前,DeepSeek的成本透明化如同一面鏡子,映照出了AI Infra企業(yè)的理想與現(xiàn)實(shí),如何更好地借鑒DeepSeek的解決方案,控制企業(yè)成本,或許才是“破局”的鑰匙,畢竟545%的理想利潤率已經(jīng)被DeepSeek“點(diǎn)出”。
當(dāng)技術(shù)紅利逐漸消退,AI Infra企業(yè)需回答更本質(zhì)的問題:是繼續(xù)內(nèi)卷于算力租賃的價格戰(zhàn),還是以模型優(yōu)化、場景深耕和生態(tài)整合構(gòu)建真正的壁壘?這場爭議或許只是序幕,行業(yè)的生存法則正在被重新書寫。
記者聯(lián)系郵箱:luoyidan@xjbnews.com
新京報貝殼財經(jīng)記者 羅亦丹
編輯 王進(jìn)雨
校對 柳寶慶