這是榮獲“全球大模型第一股”桂冠成功并在港交所敲鐘后,智譜創(chuàng)始人唐杰的首次登臺;是完成5億美元C輪融資后,Kimi創(chuàng)始人楊植麟首次對外闡述觀點(diǎn);是因履新騰訊廣受外界關(guān)注后,騰訊“CEO/總裁辦公室”首席AI科學(xué)家姚順雨首次亮相;也是Qwen技術(shù)負(fù)責(zé)人林俊旸一次密集的觀點(diǎn)輸出。

 

這就是1月10日,由清華大學(xué)基礎(chǔ)模型北京市重點(diǎn)實(shí)驗(yàn)室、智譜AI發(fā)起的AGI—Next前沿峰會。新京報貝殼財經(jīng)記者在現(xiàn)場發(fā)現(xiàn)了一個細(xì)節(jié):雖然上述四人所在的智譜、Kimi、元寶、千問幾乎代表了當(dāng)前中國基礎(chǔ)大模型的“半壁江山”,但會議現(xiàn)場最中央的嘉賓位置給了包括中國人工智能領(lǐng)域“開山鼻祖”、91歲清華大學(xué)教授張鈸等在內(nèi)的四位重量級院士,除了唐杰作為主持人需要頻繁上臺外,楊植麟等坐在了第二排。

 

會議上,唐杰闡述了如何“讓機(jī)器像人一樣思考”,楊植麟展示了Kimi K2在訓(xùn)練過程中如何通過優(yōu)化模型畫出“2025年最漂亮的曲線圖”。而在圓桌討論環(huán)節(jié),姚順雨則詳細(xì)闡述了自己履新騰訊后的感受,對中美AI行業(yè)不同的體感,以及對下一代AI范式的思考。

 

貝殼財經(jīng)記者注意到,在這場時長約三個半小時、充滿學(xué)術(shù)氛圍的會議上,四位院士專家聽到了最后。張鈸院士甚至抽空兒做了一個PPT,并進(jìn)行了總結(jié)發(fā)言。張鈸說,“在大語言模型出現(xiàn)之前,我非常不贊成我的學(xué)生去創(chuàng)業(yè)。但大模型出現(xiàn)后,我覺得最優(yōu)秀的學(xué)生應(yīng)該去搞企業(yè),因?yàn)槿斯ぶ悄軙x一切,也定義了未來的企業(yè)家。要把人工智能作為像水和電那樣交給人類,企業(yè)家也必須擔(dān)當(dāng)起社會的責(zé)任?!?/p>

 

張鈸院士在演講中表示要“重新定義AI時代的企業(yè)家”。貝殼財經(jīng)記者羅亦丹/攝

 

唐杰:像做咖啡一樣專注做研究,AGI值得長期投入


智譜AI創(chuàng)始人、首席科學(xué)家唐杰現(xiàn)場發(fā)表演講。主辦方供圖

 

作為本次活動的“東道主”,智譜創(chuàng)始人、首席科學(xué)家唐杰兼任了會場主持人的角色。貝殼財經(jīng)記者注意到,在活動開始之前,不少行業(yè)人士,甚至包括記者自己都前去向他“恭喜上市”,但唐杰仍然保持著學(xué)者本色,禮貌回應(yīng)后就一心沉浸在修改報告中。

 

唐杰的演講題目是“讓機(jī)器像人一樣思考”,自2006年清華畢業(yè)至今,他剛好度過了20年?;厥走^往,唐杰總結(jié)自己“也就做了兩件事”:一、當(dāng)年的AMiner系統(tǒng),二、現(xiàn)在的大模型。

 

從唐杰的身上,看不出一點(diǎn)公司創(chuàng)始人的商人色彩。他表示自己一貫有一個觀點(diǎn),就是“用像做咖啡一樣的專注精神來做事”,而現(xiàn)在他碰到了AGI(通用人工智能),這正好是需要長期投入、長期做的一件事,“AGI不是短平快,今天我做明天就能開花結(jié)果,它很長期,很值得投入?!?/p>

 

因此,他帶領(lǐng)團(tuán)隊(duì)果斷暫停當(dāng)時已具國際影響力的圖神經(jīng)網(wǎng)絡(luò)、知識圖譜研究,全員轉(zhuǎn)向大模型領(lǐng)域。在他看來,2025年RLVR(可驗(yàn)證獎勵強(qiáng)化學(xué)習(xí))迎來爆發(fā),讓模型能夠在可驗(yàn)證環(huán)境中自主探索,實(shí)現(xiàn)自我成長。但行業(yè)挑戰(zhàn)依然存在,如何將可驗(yàn)證場景拓展到半自動甚至不可驗(yàn)證領(lǐng)域,成為全球科研團(tuán)隊(duì)共同面對的課題。

 

唐杰表示,2025年初,DeepSeek的橫空出世讓他及其團(tuán)隊(duì)意識到,Chat范式已接近發(fā)展瓶頸,行業(yè)新方向應(yīng)是“讓 AI 真正做事”?;谶@一判斷,智譜選擇整合 Coding(編程)、Agentic(智能體)、Reasoning(推理)三大核心能力,于7月發(fā)布GLM-4.5模型。該模型在12項(xiàng)基準(zhǔn)測試中表現(xiàn)亮眼。

 

但對于當(dāng)前的中美模型差距,唐杰強(qiáng)調(diào)行業(yè)需保持清醒認(rèn)識:中美大模型領(lǐng)域的差距仍在拉大,美國在閉源模型領(lǐng)域的深耕值得國內(nèi)團(tuán)隊(duì)警惕。展望未來,AGI的發(fā)展需突破三大核心能力:一是多模態(tài)感統(tǒng),實(shí)現(xiàn)多源信息的統(tǒng)一感知;二是完善記憶系統(tǒng),構(gòu)建從個人三級記憶到人類第四級記錄的完整體系;三是探索反思與自我認(rèn)知能力,這一具有爭議性的研究方向,仍具備極高的探索價值。

 

對于2026年的發(fā)展規(guī)劃,唐杰透露,智譜將聚焦三大方向:持續(xù)推進(jìn)Scaling(記者注:可理解為數(shù)據(jù)規(guī)模)已知邊界與未知范式的探索;推進(jìn)模型架構(gòu)創(chuàng)新,解決超長上下文與知識壓縮的核心問題;深耕多模態(tài)感統(tǒng)技術(shù),助力 AI 真正進(jìn)入物理世界。他堅(jiān)信,AI for Science 即將迎來爆發(fā)期,而 AGI 的終極探索,正是讓機(jī)器像人類一樣探索未知——這既需要科研團(tuán)隊(duì)的專注堅(jiān)守,更需要敢于挑戰(zhàn) “不可能”的勇氣。


楊植麟:當(dāng)你有一個優(yōu)雅的方法,就可以得到一個優(yōu)雅的結(jié)果


月之暗面創(chuàng)始人楊植麟現(xiàn)場發(fā)布演講。貝殼財經(jīng)記者羅亦丹/攝

 

“當(dāng)你有一個優(yōu)雅的方法,就可以得到一個優(yōu)雅的結(jié)果?!痹贏GI-Next前沿峰會上,月之暗面Kimi創(chuàng)始人、CEO楊植麟展示了Kimi K2在訓(xùn)練過程中如何通過QK-Clip馴服Muon,降低Logits的過程。他將一張平穩(wěn)下降的Loss(模型訓(xùn)練損失值)曲線圖稱為“2025年見過最漂亮的東西”。

 

十幾天前,12月31日,楊植麟曾發(fā)布內(nèi)部信,其中提到,(作為)中國首個萬億參數(shù)基座模型、第一個開源的Agentic Model、在最核心Benchmark(模型性能基準(zhǔn)測試),例如在HLE上超越OpenAI,第一次成功使用二階優(yōu)化器做大規(guī)模訓(xùn)練,K2系列模型讓Kimi從中國走向了世界。

 

基于Kimi K2、K2 Thking等模型在技術(shù)上取得的突破,楊植麟對中國的開源模型充滿信心。峰會上,楊植麟直言:我覺得很多中國的開源模型逐漸成為新的標(biāo)準(zhǔn)。

 

K2之后,Kimi下一步將從哪些方面破解人工智能領(lǐng)域尚未解決的問題?

 

楊植麟表示,K2之后,Kimi在持續(xù)探索下一代模型有可能長什么樣。技術(shù)路線上,Kimi將在目前開源的Kimi Linear的基礎(chǔ)上做更多的優(yōu)化和改進(jìn)來訓(xùn)練K3模型,最重要的一個改進(jìn)方向是優(yōu)化大模型的線性注意力機(jī)制在長距離任務(wù)上的表現(xiàn)。

 

對于業(yè)界普遍關(guān)注的Scaling問題,楊植麟介紹,Kimi將在K2的基礎(chǔ)上做更多的Scaling,但同時他也提出不一樣的觀點(diǎn),Scaling并不只是加算力,而是做更多技術(shù)改進(jìn),這些技術(shù)改進(jìn)也會等效變成Scaling的優(yōu)勢,“我覺得模型是一個很不一樣的東西,做模型的過程本質(zhì)上是創(chuàng)造一種價值觀?!?/p>

 

內(nèi)部信中,楊植麟透露,公司近期完成5億美元C輪融資且大幅超募,當(dāng)前現(xiàn)金持有量超過100億元。楊植麟也在內(nèi)部信中表現(xiàn)出十足的底氣,他寫道,相較于二級市場,我們判斷還可以從一級市場募集更多資金,“所以我們短期不著急上市。當(dāng)然未來我們計劃將上市作為手段來加速推動AGI,擇時而動,主動權(quán)掌握在我們手中?!?/p>

 

演講尾聲,楊植麟分享了一段和Kimi探討“AGI/ASI的到來,可能帶來更美好的未來,但也可能威脅人類,作為研究AGI/ASI的科學(xué)家,是否還要繼續(xù)開發(fā)”的對話,也借此表達(dá)他本人對這一問題的看法。Kimi給出的答案是,即使存在風(fēng)險,仍然會繼續(xù)開發(fā),因?yàn)榉艞堿GI/ASI,意味著放棄了人類文明的潛力。

 

“我希望在接下來的十年、二十年時間,繼續(xù)把K4、K5到K100做得更好。”楊植麟坦言,所有技術(shù)的突破都伴隨著風(fēng)險,不能因?yàn)榭謶侄磺埃炊鴳?yīng)該進(jìn)一步去突破,同時,控制好風(fēng)險。

 

姚順雨:騰訊To C基因更強(qiáng),自己更多思考如何讓大模型給用戶提供更多價值


騰訊“CEO/總裁辦公室”首席AI科學(xué)家姚順雨參與圓桌討論。主辦方供圖

 

相比唐杰和楊植麟,姚順雨的出場是在峰會的圓桌討論環(huán)節(jié),且出場極富“戲劇性”——遠(yuǎn)程連線的他在圓桌剛開始被投屏到了會場大屏幕之上,引發(fā)了現(xiàn)場笑聲,他也調(diào)侃了起來“我現(xiàn)在是不是有一個巨大的臉在會場?”

 

作為前OpenAI研究員,姚順雨擁有在中美明星公司從事AI研究的經(jīng)歷。對于自己在騰訊的“新身份”,姚順雨表示騰訊是To C基因更強(qiáng)的公司,“我們會思考怎么樣能夠讓今天的大模型或AI的發(fā)展給用戶提供更多價值,核心思考是我們發(fā)現(xiàn)很多時候需要的不是更大的模型、更強(qiáng)的強(qiáng)化學(xué)習(xí)或模仿學(xué)習(xí),而是額外的Context(上下文信息)”。

 

針對中美實(shí)驗(yàn)室的研究文化,姚順雨提出了自己的建議。他認(rèn)為“在中國大家還是更喜歡做更安全的事情”。如預(yù)訓(xùn)練這種已經(jīng)被證明可行的方向,即使技術(shù)難度很高,中國團(tuán)隊(duì)也能在短時間內(nèi)攻克;但對于長期記憶、持續(xù)學(xué)習(xí)這類未知的領(lǐng)域,大家卻很少愿意涉足。他呼吁中國研究機(jī)構(gòu)跳出“打榜”的束縛,“Claude的模型可能在編程或者軟件工程的榜單上也不是最高的,但大家都知道這個東西最好用”。他認(rèn)為,DeepSeek的做法值得借鑒,這家公司不刻意追求榜單排名,而是更關(guān)注“什么是正確的事情”“什么是用戶能體驗(yàn)出好或者不好的事情”。

 

在峰會現(xiàn)場,姚順雨還分享了對AI市場分化的觀察。他認(rèn)為當(dāng)前AI行業(yè)正呈現(xiàn)兩大分化趨勢:一是To C和To B賽道的明顯分野,二是垂直整合與模型應(yīng)用分層的路徑分化。

  

談及To C和To B的差異,姚順雨用ChatGPT和Claude Code作為典型案例?!拔覀兘裉煊肅hatGPT和去年相比的話,感受差別不是太大”,他直言,對于To C用戶而言,大部分人大部分時候不需要用到頂尖的智能,“很多用戶甚至把大模型當(dāng)作搜索引擎的加強(qiáng)版,很多時候也不知道該怎么去用,把它的智能給激發(fā)出來”。

 

但To B賽道的邏輯截然不同。姚順雨強(qiáng)調(diào),智能越高,代表生產(chǎn)力越高,商業(yè)價值也越大。他觀察到一個有趣的現(xiàn)象:美國的企業(yè)客戶愿意為最強(qiáng)的模型支付溢價。比如一個頂尖模型每月定價200美元,而次一級的模型定價50美元或20美元,但企業(yè)更傾向于選擇前者。在他看來,To B市場上,強(qiáng)模型和弱模型的分化會越來越明顯。


未來三到五年,國產(chǎn)AI可能領(lǐng)先嗎?

 

圓桌最后,關(guān)于“未來3—5年全球最領(lǐng)先的AI公司是中國團(tuán)隊(duì)的概率有多大”的問題,姚順雨、林俊旸、唐杰也均給出了自己的觀點(diǎn)。

 

姚順雨的回答很樂觀:概率很高。他的信心源于中國在多個領(lǐng)域的成功經(jīng)驗(yàn):“中國能夠復(fù)現(xiàn)很多成功案例,一些局部還會做得更好,這在制造業(yè)已經(jīng)不斷地發(fā)生?!辈贿^他也坦言,當(dāng)前全球的生產(chǎn)力和To B模型應(yīng)用,大多誕生于美國,核心原因是美國企業(yè)的支付意愿更強(qiáng),商業(yè)環(huán)境更成熟?!敖裉煸趪鴥?nèi)做To B很難,所以很多公司會選擇出?;蛘邍H化的路徑”。在他看來,構(gòu)建起完善的本土To B市場,同時具備國際競爭能力,是中國AI崛起的必要前提。

 

而更重要的,是主觀層面的突破。姚順雨肯定了中國AI人才的實(shí)力:“中國有非常多非常強(qiáng)的人才,任何一個事情只要被證明能做出來,很多人都會非常積極地嘗試,并且想做得更好。”但他也表示,國內(nèi)想要突破新范式或者做冒險探索的人還不夠多,這背后涉及經(jīng)濟(jì)環(huán)境、商業(yè)環(huán)境和文化等多重因素。

 

“我們到底能不能引領(lǐng)新的范式,這可能是今天唯一要解決的問題”,姚順雨強(qiáng)調(diào),在商業(yè)、產(chǎn)業(yè)設(shè)計和工程層面,中國已經(jīng)具備比肩甚至超越美國的能力,唯獨(dú)在前沿范式的探索上,還需要更多有創(chuàng)業(yè)精神和冒險精神的人,敢于投身未知的領(lǐng)域。

 

林俊旸則指出了中美算力的差距,“美國算力可能整體比我們大1—2個數(shù)量級,我看到OpenAI等投入了大量的算力到下一代研究中,而我們則捉襟見肘,可能交付就占到了絕大部分算力,這是一個比較大的差異?!?/p>

 

但他也表示,隨著教育的普及和研究人員年齡逐漸年輕,當(dāng)前中國AI從業(yè)者的冒險精神正變得越來越強(qiáng),“我屬于90年代靠前,(姚)順雨90年代靠后,我們團(tuán)隊(duì)里還有許多00后,未來我們的創(chuàng)新概率也會越來越大?!?/p>

 

唐杰則坦言,中國企業(yè)界的AI Lab(AI實(shí)驗(yàn)室)與美國仍存在差距,但他對未來充滿信心。他認(rèn)為,中國的機(jī)會在于三個方面:一是90后、00后一代創(chuàng)業(yè)者敢于冒險,愿投身核心創(chuàng)新;二是營商環(huán)境正逐步改善,若能進(jìn)一步優(yōu)化,讓創(chuàng)新者擺脫繁雜事務(wù)、聚焦研發(fā),將釋放更大潛力;三是從業(yè)者的堅(jiān)持——身處環(huán)境持續(xù)變好的時代,經(jīng)歷本身即財富,只要敢闖敢試、久久為功,未必不能走到最后。

 

新京報貝殼財經(jīng)記者 羅亦丹 張曉慧

編輯 岳彩周

校對 劉軍