新京報貝殼財經(jīng)記者羅亦丹使用AI生成


北京時間2月24日,三家中國頭部AI公司DeepSeek、月之暗面、MiniMax遭到了AI編程頂流模型Claude的母公司Anthropic“點名批評”。

 

Anthropic稱,這些中國公司“用2.4萬個‘馬甲賬號’進行了1600萬次對話,目的是提取Claude的能力來訓練自己的模型”,其還創(chuàng)造了一個詞匯,稱這是“工業(yè)規(guī)模蒸餾攻擊”。

 

不過,這一指控隨即遭到了埃隆·馬斯克無情的“嘲諷”:“他們怎么敢偷Anthropic從人類程序員那里偷來的東西”“Anthropic公司大規(guī)模竊取訓練數(shù)據(jù),并為此支付了數(shù)十億美元的賠償金。這是不爭的事實?!?/p>

 

馬斯克在社交平臺發(fā)布的貼文

 

另一方面,近年來國產(chǎn)模型能力不斷提高,不少廠商已經(jīng)將發(fā)展目標指向了Claude最引以為豪的編程能力。在被“點名”的同時,MiniMax、Kimi等國產(chǎn)模型的收入、調(diào)用量等指標已再創(chuàng)新高。中國AI公司正在用事實證明,技術(shù)封鎖和空口指控無法阻擋國產(chǎn)AI的發(fā)展。

 

蒸餾也能成“攻擊手段”?

 

蒸餾技術(shù)本無罪,問題在于誰在用、怎么用。

 

模型蒸餾是AI領(lǐng)域的標準訓練技術(shù),通過讓大模型指導小模型學習,實現(xiàn)知識遷移和模型壓縮。例如,DeepSeek在金融場景實踐中將175B參數(shù)模型壓縮至7B,推理成本降低98%的同時保持了95%以上核心指標;MiniMax的M2.5模型在SWE-bench Verified上達到80.2%,與Claude Opus 4.6的80.8%幾乎持平,但成本僅為后者的1/20。

 

當前,蒸餾技術(shù)被全球AI公司普遍使用,包括OpenAI、谷歌、Meta等巨頭都在自家模型上應用。事實上,就連Anthropic自己也在指控三家中國公司后,補充了一句“蒸餾法是合理的:人工智能實驗室利用蒸餾為客戶創(chuàng)建更小、更便宜的模型?!敝徊贿^,后面又跟上了一句“一些境外實驗室非法提煉美國模型后,可移除其安全防護機制,將模型技術(shù)能力應用于本國的軍事、情報及監(jiān)控系統(tǒng)中?!?/p>

 

可以發(fā)現(xiàn),Anthropic的邏輯是:蒸餾本身無罪,但當中國公司使用時,就成了“非法竊取”。

 

Anthropic聲稱,通過IP地址、請求元數(shù)據(jù)等信息將“攻擊”追溯到了具體實驗室,甚至以“與員工公開資料匹配”為由指向中國公司。但目前,這些指控僅為Anthropic的“一面之詞”。

 

有聲音認為,這樣的溯源方式在法律層面難以成立,蒸餾技術(shù)遷移的是功能邏輯而非直接復制數(shù)據(jù),更貼近法律允許的“反向工程”范疇。簡單扣上“盜竊”帽子,并不能掩蓋證據(jù)薄弱的事實。

 

這種指控也讓人感覺是“賊喊捉賊”。Anthropic本身有過“竊取數(shù)據(jù)”的“黑歷史”:2025年9月,Anthropic 因大規(guī)模從LibGen、PiLiMi等盜版網(wǎng)站非法下載超700萬本受版權(quán)保護的圖書,并使用這些盜版書籍訓練AI模型,被迫向以作家安德里亞?巴茨(Andrea Bartz)為首的全球作家集體支付了15億美元和解金。正如馬斯克所說,“這是不爭的事實?!?/p>

 

當前,AI行業(yè)尚處于規(guī)則空白期,蒸餾技術(shù)的邊界在哪里、數(shù)據(jù)使用的底線是什么,需要全球共同制定標準。商業(yè)競爭無可厚非,但動輒扣帽子、搞雙重標準,只會阻礙技術(shù)創(chuàng)新與普惠。當OpenAI、谷歌、Anthropic自己都在大規(guī)模使用未經(jīng)許可的數(shù)據(jù)訓練模型時,他們對“蒸餾”的指控,更像是維護既得利益的防御性反應。

 

不懼指責,中國AI模型奮起直追

 

對于Anthropic的單方面指責,月之暗面和MiniMax均未予以回應,其用意很明顯:用數(shù)據(jù)和事實說話。

 

DeepSeek自2026年以來發(fā)表了多篇論文,并一以貫之地開源其最新研究成果,將“降本增效”貫徹到底。同時,DeepSeek也正在對新模型進行灰度測試,V4“呼之欲出”。

 

月之暗面方面向貝殼財經(jīng)記者透露,在完成上一輪5億美元融資僅一個多月后,其將完成新一輪超7億美元的融資并再次超募,本輪由阿里、騰訊、五源、九安等聯(lián)合領(lǐng)投。新一輪100億—120億美元估值的融資已經(jīng)開啟,并已收到多家機構(gòu)意向。連續(xù)兩輪超12億美元的融資,創(chuàng)下近一年來大模型行業(yè)的最高融資紀錄。

 

此前字節(jié)估值突破百億美元大關(guān)用時超4年,拼多多用時超3年,Kimi僅用兩年多的時間就實現(xiàn)估值30多倍的增長。照此看來,Kimi有望創(chuàng)下國內(nèi)公司從成立到估值超100億美元的最快成長速度。

 

而在模型的調(diào)用量方面,月之暗面旗下的Kimi K2.5大模型發(fā)布不到一個月,其近20天累計收入已超過2025年全年總收入。根據(jù)OpenRouter,Kimi K2.5的調(diào)用量在OpenClaw的模型調(diào)用榜中排名第一。

 

MiniMax方面則向貝殼財經(jīng)記者披露,春節(jié)前夕MiniMax 開源新一代模型 M2.5,發(fā)布12小時內(nèi)登頂OpenRouter熱度榜,一周內(nèi)登頂調(diào)用量榜首,周調(diào)用量暴漲至3.07T tokens。OpenRouter 整體調(diào)用量也在同步攀升。官方隨后確認,M2.5 帶動了100K至1M 長文本區(qū)間的增量調(diào)用需求,而這個區(qū)間正是Agent工作流的典型消耗場景。

 

事實上,中國AI公司的快速進步,源于龐大的工程師群體、豐富的數(shù)據(jù)資源、完善的產(chǎn)業(yè)鏈,以及對開源開放路線的堅持。DeepSeek、Kimi、MiniMax在編程、多模態(tài)、Agent等領(lǐng)域的突破,是技術(shù)創(chuàng)新與場景深化的結(jié)果。

 

新京報貝殼財經(jīng)記者 羅亦丹

編輯 岳彩周

校對 柳寶慶