新京報(bào)貝殼財(cái)經(jīng)訊(記者羅亦丹)北京時(shí)間11月4日,備受關(guān)注的首個(gè)AI大模型實(shí)時(shí)投資比賽“Alpha Arena”落下帷幕,該競(jìng)賽由三方機(jī)構(gòu)Nof1于10月18日發(fā)起,集合來自中國(guó)的DeepSeek v3.1、Qwen3-Max,以及來自美國(guó)的GPT-5、Gemini 2.5 Pro、Claude Sonnet 4.5、Grok 4,共六個(gè)頂尖大模型,每個(gè)模型擁有一萬美元初始資金,在真實(shí)市場(chǎng)上無人工干預(yù)地自主決策、交易,根據(jù)盈虧情況決出冠軍。


比賽前半段,DeepSeek v3.1一直處于領(lǐng)先位置,這也讓這場(chǎng)比賽廣受國(guó)際關(guān)注。能夠與之“一戰(zhàn)”的是馬斯克旗下的Grok 4,其通過激進(jìn)的投資策略,一度把與DeepSeek v3.1的差距縮短到1美元的位置。


不過,10月21日至22日成為了“轉(zhuǎn)折點(diǎn)”,這兩日里,Grok 4和Claude Sonnet 4.5的收益大幅下滑,由盈轉(zhuǎn)虧,10月22日當(dāng)日,六個(gè)大模型的收益率更是一度全部告負(fù)。


但此時(shí),DeepSeek v3.1和此前表現(xiàn)不佳的Qwen3-Max自動(dòng)改寫了投資策略,在其他4個(gè)大模型持續(xù)虧損的情況下脫穎而出,凈值曲線波動(dòng)上漲,Qwen3-Max更是趁機(jī)一度超過DeepSeek v3.1。


此后,比賽成為了Qwen3-Max與DeepSeek v3.1兩家中國(guó)大模型“爭(zhēng)鋒”的舞臺(tái),參賽模型大致分為三大陣營(yíng):兩家中國(guó)模型屢次互換第一,始終位列第一梯隊(duì);Claude Sonnet 4.5和Grok 4在相近策略驅(qū)動(dòng)下,維持在第二陣營(yíng),略有盈利,整體仍虧損;GPT-5、Gemini 2.5 Pro兩大模型則長(zhǎng)期虧損墊底。


最終,截至11月4日比賽落幕時(shí),這場(chǎng)歷時(shí)17天、初始資金一萬美元的投資大賽,Qwen3-Max以1.22萬美元,超過20%的收益率奪得冠軍,DeepSeek v3.1落袋1.05萬美元。這兩個(gè)中國(guó)模型也成為唯二盈利的模型,而四大美國(guó)頂尖模型全部虧損,GPT-5虧損超60%墊底。


編輯 陳莉 校對(duì) 劉軍