DeepSeek API服務(wù)到底“虧不虧”？

圖/IC

北京時間3月1日中午，DeepSeek于“開源周”收官之際在知乎發(fā)文，不僅解讀了關(guān)鍵的降本增效技術(shù)，還首次公開了API服務(wù)的成本、收入以及理論上高達545%的利潤率。不過，這也意外引發(fā)了兩家為用戶提供DeepSeek服務(wù)的MaaS供應(yīng)商“互懟”，讓國內(nèi)AI Infra（人工智能基礎(chǔ)設(shè)施）企業(yè)罕見成為“吃瓜大戲”的主角。

MaaS，直譯為模型即服務(wù)，指將模型部署到企業(yè)端提供給用戶服務(wù)。春節(jié)期間DeepSeek“服務(wù)器繁忙”時，不少從事MaaS服務(wù)的大模型基礎(chǔ)設(shè)施公司，如潞晨科技、硅基流動等為用戶提供了使用“滿血版”DeepSeek的機會。

對于該項服務(wù)，潞晨科技創(chuàng)始人尤洋曾公開發(fā)文表示“MaaS模式下用戶越多虧損越多”，而隨著DeepSeek公開成本和利潤率，面對網(wǎng)友質(zhì)疑，尤洋發(fā)文反駁并一度“辣評”競對公司硅基流動，最終和硅基流動創(chuàng)始人袁進輝開始“互懟”。此后，更延展到此前潞晨科技涉及的抄襲風(fēng)波上，引來了更多圈內(nèi)人士“下場”。

對此，中存算董事長陳巍評價道：“創(chuàng)業(yè)不易，創(chuàng)新不易，需要多一點寬容。技術(shù)上偶爾出現(xiàn)判斷偏差都很正常。”而對于究竟DeepSeek的MaaS服務(wù)“虧不虧”這一問題，陳巍對新京報貝殼財經(jīng)記者表示，“這個問題已經(jīng)超出純技術(shù)討論范疇了，涉及產(chǎn)品定位和AI Infra企業(yè)的求生。建議雙方擱置爭議，抓緊時間做Infra優(yōu)化，搶占用戶日活攀升的產(chǎn)業(yè)窗口期?！?/p>

DeepSeek展示盈利能力：一天收入56.2萬美元，理論成本利潤率545%

事件發(fā)生在DeepSeek的“開源周”行將結(jié)束之際——此前，DeepSeek曾表示將在從2月24日開始的“開源周”發(fā)布五項開源成果，但當(dāng)五項成果全部發(fā)布結(jié)束后的第六天，DeepSeek又發(fā)布了《DeepSeek-V3/R1推理系統(tǒng)概覽》技術(shù)文章，首次公布了模型推理系統(tǒng)降本增效的優(yōu)化細節(jié)。

該篇文章以DeepSeek推理系統(tǒng)的優(yōu)化目標(biāo)：更大的吞吐，更低的延遲為核心，詳細介紹了其解決方案：使用大規(guī)模跨節(jié)點專家并行（Expert Parallelism / EP）。以通俗的方式來理解，就類似把AI模型拆分成多個“小專家”，分散到不同的顯卡（GPU）上運行。就像餐館里多個廚師同時備菜，每個廚師只負責(zé)自己最擅長的部分，整體出餐速度更快。V3系統(tǒng)中，每層有256個專家，但每次只用8個，通過動態(tài)分配實現(xiàn)高效計算。

此外，當(dāng)不同顯卡之間需要傳遞數(shù)據(jù)時，系統(tǒng)會像工廠流水線一樣，讓計算和傳輸同時進行。例如在生成文字時，前一部分還在計算，后一部分已經(jīng)開始傳輸，避免“干等”浪費時間。

對此，袁進輝評論道，“DeepSeek官方披露大規(guī)模部署成本和收益，又一次顛覆了很多人的認知?，F(xiàn)在很多供應(yīng)商還做不到這個水平，主要是V3/R1架構(gòu)和其他主流模型差別太大了，由大量小Expert（專家）組成，導(dǎo)致瞄準(zhǔn)其他主流模型結(jié)構(gòu)開發(fā)的系統(tǒng)都不再有效，必須按照DeepSeek報告描述的方法才能達到最好的效率，而開發(fā)這樣的系統(tǒng)難度很高，需要時間，幸好這周DeepSeek五連發(fā)已經(jīng)把主要模塊開源出來了，降低了社區(qū)復(fù)現(xiàn)的難度?！?/p>

一個可以讓人直觀感受DeepSeek效率的數(shù)據(jù)是，其在文章最后展示了以2月27日12:00至2月28日12:00，一天內(nèi)DeepSeek V3和 R1推理服務(wù)占用的節(jié)點，并統(tǒng)計了包括網(wǎng)頁、APP和API的所有負載，推算發(fā)現(xiàn)假定GPU租賃成本為2美元/小時，總成本為 8.7萬美元，若所消耗的tokens（算力計價單位）全部按照DeepSeek R1的API定價計算，理論上一天的總收入為56.2萬美元，成本利潤率為545%。

DeepSeek在知乎的文章中披露了其推算的成本、理論收入和利潤率圖片來源：知乎截圖

“這份成本利潤披露看似坦誠，實則暗藏殺機。它告訴所有人：大模型的游戲規(guī)則早已變了，單靠算法或者簡單囤積算力不能贏得大模型的勝利。在算法+數(shù)據(jù)+算力的三要素中，有效算力（算力x算力效率）才是最暴力美學(xué)的生存規(guī)則，唯快不破這個道理也適用于大模型行業(yè)。這份數(shù)據(jù)事實上是三頭六臂‘大鬧東海，腳踢很白的宮’的技術(shù)演繹，也是‘算力+智力’逆風(fēng)翻盤的真實寫照?！标愇”硎?。

值得注意的是，此前DeepSeek的重要信息發(fā)布一般在X、GitHub等以英文為主的平臺，而本次的發(fā)布還額外登錄了知乎，這瞬間引發(fā)了國內(nèi)AI圈的熱情，截至3月3日早，DeepSeek發(fā)布的文章在知乎獲得了7735個贊，以及866條評論。

尤洋遭網(wǎng)友“點名” DeepSeek API服務(wù)到底“虧不虧”？

新京報貝殼財經(jīng)記者注意到，不少網(wǎng)友本著“看熱鬧不嫌事大”的心態(tài)在這篇文章的評論區(qū)里“呼叫尤洋”，其中一條@尤洋知乎賬號的評論獲得了475個點贊，點贊數(shù)為評論區(qū)第二高。

這是因為，此前尤洋曾發(fā)文直言“MaaS在中國短時間內(nèi)可能是最差的商業(yè)模式”“滿血版DeepSeek R1每日輸出1000億tokens，那么每個月虧損4億”，引發(fā)了業(yè)界對MaaS商業(yè)模式的爭論。

潞晨科技創(chuàng)始人尤洋微博截圖

AI與云基礎(chǔ)設(shè)施專家左鵬飛表示，DeepSeek和尤洋之間觀點沖突的主要原因是對每臺H800機器能跑出多大吞吐量的認知不同。

“根據(jù)尤洋老師的采訪視頻，4臺機器跑出的吞吐量是1K tokens/s，而DeepSeek官方跑出的數(shù)據(jù)是平均每臺機器14.8K tokens/s, 有14.8*4 ≈ 59倍的性能差距。不同MaaS服務(wù)提供商對相同機器上相同模型跑出來的吞吐量可以相差59倍，那么自然有的MaaS服務(wù)商能掙錢，有的MaaS服務(wù)商大虧錢。這也證明AI Infra的系統(tǒng)優(yōu)化能力是多么重要。”左鵬飛說。

對于網(wǎng)友的“點名”，尤洋本人也發(fā)文進行了回應(yīng)，他認為DeepSeek文章中的數(shù)據(jù)對計算MaaS成本沒有太多參考價值，因為文章把DeepSeek網(wǎng)頁，APP和MaaS API的token數(shù)加在一起計算，且數(shù)據(jù)是建立在大量用戶把DeepSeek的APP和網(wǎng)頁完全超負荷占滿的情況下，不是一個常規(guī)的MaaS。

貝殼財經(jīng)記者發(fā)現(xiàn)，DeepSeek提到的545%利潤率更多指的是“理想情況”，DeepSeek在官方文章里也表示“當(dāng)然我們實際上沒有這么多收入，因為V3的定價更低，同時收費服務(wù)只占了一部分，另外夜間還會有折扣?！?/p>

尤洋強調(diào)，自己對DeepSeek的模型能力沒有貶低，但其使用體驗非常差，“我春節(jié)期間用過幾次，問一個問題，然后說繁忙，讓我稍后嘗試，我等了15分鐘或者一小時。這不是一個合格的MaaS產(chǎn)品?！?/p>

似乎為了證明自己的觀點，尤洋在發(fā)布完回應(yīng)文章后，宣布潞晨科技將在一周后停止提供DeepSeek的API服務(wù)，

潞晨科技公眾號截圖

對此，左鵬飛告訴新京報貝殼財經(jīng)記者，尤洋的觀點有一定的道理，但“即使考慮上資源預(yù)留，也就是545%的利潤率除以2或3，依然是盈利的，不影響我提到的核心邏輯?！?/p>

兩家MaaS供應(yīng)商開吵“嘴架” 引出抄襲“舊賬”

這一事情的發(fā)展開始逐漸“跑偏”。尤洋在回復(fù)網(wǎng)友后，又在知乎發(fā)文，矛頭直指春節(jié)期間最早開始承接DeepSeek流量，為用戶提供“滿血版DeepSeek服務(wù)”的硅基流動，認為該公司“犧牲員工春節(jié)假期捆綁華為宣傳、在小紅書拉人頭、API速度慢”等。

對此，袁進輝在朋友圈反擊稱“我們團隊愿意拼搏抓一個機會有什么錯？邀請用戶送點免費券有什么錯？春節(jié)那幾天，全民都想訪問DeepSeek而不得時，我們提供了僅有的一個穩(wěn)定的服務(wù)?！蓖瑫r，他還提到了此前潞晨科技曾抄襲過硅基流動。

這導(dǎo)致更多AI圈人士被牽涉進來，如尤洋提到該起抄襲事件代碼的負責(zé)人是原潞晨科技CTO方佳瑞，但后者發(fā)長文回應(yīng)了自己的“背鍋”經(jīng)歷，表示代碼在自己入職之前就已存在。

此外，橘皮優(yōu)團隊在2024年11月發(fā)布的對潞晨科技的公開信也被挖出，該公開信提到，“潞晨云算力云平臺公然抄襲我們的業(yè)務(wù)模式和機主協(xié)議，侵犯了知識產(chǎn)權(quán)。”袁進輝轉(zhuǎn)發(fā)了該公開信并配文稱：“不是一次抄襲，多次發(fā)生?！?/p>

貝殼財經(jīng)記者注意到，雖然潞晨科技和硅基流動彼此指責(zé)，但二者都曾和華為云合作，為用戶推出基于國產(chǎn)算力的DeepSeek服務(wù)，而在DeepSeek公布開源方案之后，這些AI Infra企業(yè)能否復(fù)現(xiàn)DeepSeek的技術(shù)細節(jié)，從中攤薄成本，就成了考驗企業(yè)技術(shù)實力的時候。

值得注意的是，雖然DeepSeek在過去一周中開源了多個代碼庫，但大多數(shù)是針對英偉達芯片架構(gòu)的。對此，有開發(fā)者告訴貝殼財經(jīng)記者，這些開源成果無法直接用在華為云的推理服務(wù)中，但其思想可以借鑒。

當(dāng)前，DeepSeek的成本透明化如同一面鏡子，映照出了AI Infra企業(yè)的理想與現(xiàn)實，如何更好地借鑒DeepSeek的解決方案，控制企業(yè)成本，或許才是“破局”的鑰匙，畢竟545%的理想利潤率已經(jīng)被DeepSeek“點出”。

當(dāng)技術(shù)紅利逐漸消退，AI Infra企業(yè)需回答更本質(zhì)的問題：是繼續(xù)內(nèi)卷于算力租賃的價格戰(zhàn)，還是以模型優(yōu)化、場景深耕和生態(tài)整合構(gòu)建真正的壁壘？這場爭議或許只是序幕，行業(yè)的生存法則正在被重新書寫。

記者聯(lián)系郵箱：luoyidan@xjbnews.com

新京報貝殼財經(jīng)記者羅亦丹

編輯王進雨

校對柳寶慶

34 +1

微博

微信