不久前

 

她以小米MiMo大模型負責人的身份登臺亮相

 

在圈內(nèi)掀起一波熱度

 

人們習慣性地賦予她

 

“95后AI天才少女”的標簽

 

她卻自稱“低起點者”

 

從四川宜賓第一中學到北京師范大學

 

再到保研北京大學

 

她并不是拔尖的學生

 

但她始終帶著一股不服輸?shù)念B強精神

 

面對外界的贊譽與好奇

 

她的選擇是——“后退一步”

 

在朋友圈寫下

 

“請互聯(lián)網(wǎng)還我一片安安靜靜做事的氛圍吧……

 

只想安安靜靜做難而正確的事情。”

 

從燕園實驗室里那些為代碼苦惱的日夜

 

到如今在工業(yè)界萬卡集群前的運籌帷幄

 

北大信息科學技術(shù)學院2017級校友羅福莉

 

講述了自己的“破題”之路——

 

不僅是關(guān)于技術(shù)的突破

 

更是一位北大人如何在

 

日新月異的科技浪潮中

 

守住內(nèi)心,尋找確定的答案

 

▽點擊視頻,走近了解羅福莉▽

 

把失敗排除掉,剩下的就是運氣

 

能在年紀輕輕便執(zhí)掌大模型核心研發(fā)的人物,大眾往往傾向于相信他們拿著“天選之子”的劇本。但羅福莉?qū)Α疤觳派倥边@個標簽表現(xiàn)出了近乎本能的排斥。

 

“這類標簽是為了吸引注意力而創(chuàng)造的刻板印象,”羅福莉的語氣平靜卻堅定,“它粉飾了科研過程中真正的努力、堅韌和全心投入,暗示成功是天生的。”

 

剝離掉這些光環(huán),她的成長軌跡樸素而扎實。

 

 

她通過一步步探索使學業(yè)名列前茅,甚至在走近學術(shù)的過程中成功拿到了北大的保研資格。進入北大,是羅福莉人生中一次重要的轉(zhuǎn)折點。她陸續(xù)向各大計算機科學期刊投出一篇篇文章。在頻繁往返于圖書館與宿舍之間的道路上,她走到了“黎明前的黑暗”,“研究生二年級是我最忙的一年,那時候除了寫代碼、上課,幾乎什么都不去想”,她如此回憶。而幸運的是,這一年,也是她的收獲之年——在人工智能領(lǐng)域頂級國際會議ACL上發(fā)表8篇論文(其中2篇為第一作者)。

 

面對科研深水區(qū)時,羅福莉這種比常人更強的耐受力,其實來自于父母從小給予的“不設(shè)限”的教育觀——鼓勵她設(shè)定高目標,并勇于挑戰(zhàn)。

 

 

羅福莉與父親合影

 

羅福莉最初的研究興趣落點于自然語言處理(NLP)中一個非常細分的領(lǐng)域——詞義消歧。但隨著大模型技術(shù)的興起,她敏銳地發(fā)現(xiàn):傳統(tǒng)消歧任務的本質(zhì)正被大模型的“下一個詞預測”范式所覆蓋。這種基于技術(shù)底蘊的超前預判,促使她果斷將重心轉(zhuǎn)向文本生成,而這在本質(zhì)上與GPT系列大模型的核心任務高度一致。也正是這段對語言概率分布建模的經(jīng)驗,讓她進入工業(yè)界后,自然地踏上了大模型的研究旅程。

 

“做難而正確的事”,這句話現(xiàn)在掛在很多人的嘴邊,但對羅福莉而言,這是她科研邏輯的基石,更是一種關(guān)于“失敗”的哲學。

 

在羅福莉的記憶中,早期的科研探索充滿了在理論與現(xiàn)實間掙扎的窒息感。2017年,當她將研究重心轉(zhuǎn)向文本生成后,直面的第一個挑戰(zhàn)是驗證一個直覺上可行的idea所需的全棧能力。從親手搭建GPU集群、到從零手擼訓練框架,每一個環(huán)節(jié)都橫亙著難以逾越的鴻溝?!澳菚r候太痛苦了,”她回憶道,“任何一個細節(jié)的疏忽都可能導致推倒重來,沒有多少現(xiàn)成的工具可以依賴?!?/p>

 

這段經(jīng)歷,無意中成為了她科研生涯最深刻的啟蒙:科研不是飄在空中的理論,而是由無數(shù)細節(jié)夯實的工程;決定成敗的,往往就是那些最不起眼的角落。這種對細節(jié)的極致苛求,也成為了她日后在大模型研發(fā)中,能夠精準把控復雜系統(tǒng)的關(guān)鍵。

 

 

參加國際計算語言學學會(ACL)

 

 

參加2019年自然語言處理經(jīng)驗方法會議(EMNLP)

 

加入阿里達摩院后,她曾參與訓練千億參數(shù)模型。那是中國科技公司最早嘗試挑戰(zhàn)超大規(guī)模語言模型的時期。在工業(yè)界,算力不再是幾張卡,而是成千上萬張卡的集群。這給了她前所未有的野心?!凹热籊PT-3是千億參數(shù),如果我們把模型參數(shù)擴大,智能水平會怎樣?”這是一個極具誘惑力的問題。

 

然而,現(xiàn)實給了她當頭一棒。

 

那是她職業(yè)生涯中的第一次“滑鐵盧”。當時他們首次嘗試訓練175B(1750億)參數(shù)的模型,結(jié)果是痛苦的——模型“又大又笨拙”,訓練失敗了?!斑@是一次失敗的經(jīng)歷?!绷_福莉坦誠地復盤。

 

當時團隊只關(guān)注了ScalingLaw(縮放定律)中的參數(shù)規(guī)模,卻忽視了數(shù)據(jù)質(zhì)量的清洗,也缺乏高效的訓練框架。模型空有龐大的軀殼,卻由于“喂”進去的數(shù)據(jù)良莠不齊,導致智能水平遠未達標。她開始反思:大模型這條路,真的走得通嗎?面對問題,她選擇戰(zhàn)略性靜止,轉(zhuǎn)向確定性更強的量化研究,繼續(xù)在需要大量算力的場景下,驗證自己的研究想法。

 

 

阿里分享

 

轉(zhuǎn)機出現(xiàn)在ChatGPT橫空出世之后。那兩年的蟄伏,實際上是整個行業(yè)的蓄力期。當她加入DeepSeek(深度求索)時,所有的失敗經(jīng)驗都轉(zhuǎn)化為了寶貴的資產(chǎn)。她開始重新審視科學的研究路徑:如何精準地Scaling參數(shù)與數(shù)據(jù)?如何設(shè)計高效的訓練架構(gòu)?

 

“在DeepSeek的那段經(jīng)歷,是一次重大的轉(zhuǎn)折。”羅福莉說。這一次,曾經(jīng)讓她窒息的“全棧”磨礪,全部轉(zhuǎn)化為了精準的判斷力。她不再需要從零手擼一切,而是帶著在無數(shù)次失敗中淬煉出的對數(shù)據(jù)質(zhì)量、訓練框架的深刻理解,精準地避開了每一個曾讓她跌倒的深坑。當工業(yè)界的萬卡算力在她面前鋪開時,她終于能將那些在學校里因資源匱乏而無法觸及的宏大假設(shè),一一付諸驗證?!皬膶W術(shù)界的驗證,到工業(yè)界的作戰(zhàn)”,羅福莉完成了從一名學生到科學家的蛻變。

 

在羅福莉看來,失敗并不是無意義的歸零,而是一種必然的“成本”。“失敗尤其能幫助你排除錯誤路徑,積累運氣。”她把科研看作是一個巨大的探索空間,如果你選擇了一個折中的、簡單的問題,一旦技術(shù)風口過去,所有的努力都會隨之消散;但如果你選擇了一個本質(zhì)的、困難的問題,那么在這個過程中,每一個錯誤的嘗試都是寶貴的“訓練數(shù)據(jù)”,都在增加最終找到正確解的概率。

 

“我不是天才,”羅福莉再次強調(diào),“我的起點很普通,是對本質(zhì)問題探索的好奇心、不錯的行動力以及一點點不服輸?shù)捻g勁,才一步步走到今天?!?/p>

 

被自由托舉的浪漫與嚴謹

 

“北大自由的科研環(huán)境讓我受益匪淺?!?/strong>這種自由,不是散漫,而是一種精神上的舒展。在北大計算語言所,不同方向的研究者常常在走廊里、在去食堂的路上,因為一個突發(fā)的靈感而展開激烈的討論,然后立刻跑回實驗室做實驗。這種“即興爵士樂”般的科研氛圍,在她心中種下了創(chuàng)新的種子。

 

對羅福莉影響至深的,是她的導師穗志方教授。在羅福莉剛?cè)腴T、最迷茫的階段,穗志方老師給予了她許多的人文關(guān)懷。

 

“她更關(guān)注我的研究狀態(tài),而非急于出成果?!?/strong>羅福莉感嘆道。在那些因為實驗數(shù)據(jù)跑不通而“以淚洗面”的日子里,導師的共情力成為了支撐她走下去的力量。這種關(guān)懷讓羅福莉明白,科研不只是冰冷的邏輯推演,背后是人的心智與情感的磨礪。北大帶給她的,還有最早的“協(xié)作啟蒙”。大模型研究是一項系統(tǒng)工程,而在北大的實驗室里,她初次體會到了團隊協(xié)作的力量:有同學擅長搭建GPU集群,有人專攻算法,大家各展所長。

 

 

羅福莉(后排左二)與導師穗志方教授(前排右二)合影

 

羅福莉指著老照片里實驗室的一個角落笑著說:“這就是當時整個屋子最‘黃金’的位置,因為導師進來看不到你的屏幕?!蹦莻€角落里藏著的,不只是偶爾“摸魚”的愜意,更有獨屬于科研人的浪漫。松弛、鮮活的青春記憶,在自由的風里被溫柔托住的感覺,即便在多年后,依然是她面對壓力時最堅實的精神避風港。

 

如今,這里坐著的師弟師妹,但大家討論的話題,已經(jīng)從當年的具體任務,升級到了AGI(通用人工智能)的最前沿。雖然羅福莉?qū)ψ约旱哪承┚唧w論文成果保持著嚴苛的審視,但她卻非常樂意與師弟師妹們探討未來的方向,遇到同師門的師弟研究的新方向,甚至主動交流請教。

 

“現(xiàn)在的AI,正在深刻重構(gòu)我們做科研的方式。”在實驗室里,羅福莉興奮地和師弟師妹們分享她在產(chǎn)業(yè)一線的實踐與觀察。她提到,全新一代的大模型,已經(jīng)不只是工具,它甚至能啟發(fā)人類的靈感。

 

“未來,大模型可能會自己寫代碼、自己跑實驗、自己分析結(jié)果,甚至自我迭代。”羅福莉?qū)δ贻p的后輩們說,“技術(shù)的迅猛發(fā)展,也對我們提出了更高的要求——我們需要比AI更聰明,去定義問題,而不是單純地解題?!?/p>

 

在這個小小的實驗室里,她與同組師弟師妹們達成了某種共識:強化學習(ReinforcementLearning)將是通往AGI的關(guān)鍵鑰匙。它不僅僅是訓練手段,更是讓AI在與環(huán)境交互中進化出“空間智能”的必經(jīng)之路。這種跨越屆別的共鳴,讓人看到了北大科研人的群像——他們不是一個個孤獨的“天才”,而是一群在追求極致智能道路上,互相激發(fā)、接力奔跑的“破題者”。

 

像嬰兒一樣去理解世界

 

“學界和工業(yè)界做研究有本質(zhì)的區(qū)別。”羅福莉這樣說。學界往往將大問題拆解為精致的子問題;而工業(yè)界擁有萬卡算力和跨領(lǐng)域的團隊,能以更宏觀、更整體的視角去“暴力美學”地驗證大規(guī)模智能。當然,這并不是說學術(shù)素養(yǎng)在工業(yè)界不重要。恰恰相反,羅福莉正在做的,就是用學術(shù)的嚴謹去馴服工業(yè)界的“狂野”。

 

2025年2月,她以通訊作者身份,聯(lián)合小米與北京大學發(fā)表一篇聚焦MoE與強化學習的論文?!拔谊P(guān)注的核心問題往往足夠困難、需要大量算力資源、需要特定的研究文化和環(huán)境。破題者意味著挑戰(zhàn)難題,這正是我科研路徑上一直追求的方向。”她的目光,始終停留在比當下更遠一點的地方。

 

回到母校,和師弟師妹們漫步未名湖邊交流時,他們偶遇了一位在家人陪同下好奇張望的嬰兒寶寶,羅福莉順勢談起了一個極具哲學意味的對比——“嬰兒與AI”。

 

“一個小寶寶,哪怕只有一歲,還不會說話,但他能通過眼神的交流,精準地判斷父母的意圖,是對他的肯定還是否定?!彼葎澲?,眼中閃爍著思考的光芒,“這種‘眼力見兒’,這種基于直覺和交互的感知力,是目前最強大的大模型都做不到的?!?/p>

 

在她看來,目前的模型做的是“1-100”的事,它通過海量的文本閱讀,學會了語言,得到了解題、編程等不同方面的能力,但卻缺乏對物理世界最本能的、“0-1”的感知。它無法產(chǎn)生直覺判斷,不懂情緒,不懂人與人之間微妙的氣場。

 

“但是,大模型不能只活在語言里,它需要回到智能的原點?!边@就是羅福莉眼中AGI的下一個“無人區(qū)”:從語言智能走向世界模型(WorldModels)。

 

不久前,羅福莉作為XiaomiMiMo大模型負責人身份登臺亮相,和來自全世界各地的開發(fā)者們,分享了團隊最新成果。XiaomiMiMo-V2-Flash通過創(chuàng)新訓練范式與結(jié)構(gòu)優(yōu)化,構(gòu)建了一套兼具高效與性能的訓練體系:采用5:1的SlidingWindowAttention(SWA)與GlobalAttention(GA)混合架構(gòu),引入Multi-TokenPrediction(MTP)推理加速訓練以打破顯存帶寬瓶頸,提出Multi-TeacherOn-PolicyDistillation(MOPD)后訓練范式,僅需傳統(tǒng)SFT+RL流程1/50的計算資源即可優(yōu)化學生模型,同時通過訓推Infra深度融合,實現(xiàn)了訓練與推理的協(xié)同優(yōu)化。

 

目前,模型權(quán)重(MIT協(xié)議)、推理代碼已在HuggingFace和SGLang開源,技術(shù)報告同步發(fā)布,API限時免費開放且Web體驗平臺上線,支持一鍵接入多種開發(fā)框架。羅福莉相信“智能終將從語言走向物理世界?!痹诤罄m(xù)的發(fā)展中,XiaomiMiMo大模型也將在小米“人-車-家”生態(tài)中完成更多落地、覆蓋。

 

 

作為Xiaomi Mimo大模型生態(tài)負責人,亮相發(fā)布會

 

對于未來的智能體,她設(shè)想應該能夠像人類嬰兒一樣,通過與物理世界的交互(Interaction)、觀察和反饋來學習。它不僅能預測下一個單詞(NextTokenPrediction),更能預測未來的畫面,預測物理世界的演變。這種對本質(zhì)的執(zhí)著,也延伸到了她對人生坐標的定義上。

 

“如果未來十年要羅福莉書寫自己的人生故事,標題會是什么?”沉思之后,她給出了一個非常宏大卻又質(zhì)樸的愿景:“比起寫書,我更關(guān)注未來10年能做的有價值的研究。我特別希望參與提升中國科學研究能力,讓中國科研站上世界中央舞臺?!?/strong>

 

在她眼中,這是一代人的幸運,也是一代人的宿命。從規(guī)則系統(tǒng)到神經(jīng)網(wǎng)絡,再到如今的大模型浪潮,時代的紅利將算力變成了智力的放大器?!疤剿骺臻g越大,找到正確解的概率就越高?!彼钪袊嗄昕蒲泄ぷ髡卟粦蛔龈S者,而應有勇氣成為那個定義問題、解決問題的“破題者”。

 

在這個能讓每個人都有機會挑戰(zhàn)本質(zhì)性問題的時代,羅福莉選擇了那條“難而正確”的路。她不急于到達終點,因為她知道,在通往真理的路上,每一步扎實的腳印,都比虛幻的光環(huán)更值得被銘記。

 

 

時代浪潮奔涌,北大人慣立潮頭

 

聚焦AI變革

 

北京大學校友會推出

 

北大ai校友訪談目「弄潮」

 

持續(xù)記錄這一代北大人的關(guān)鍵抉擇

 

 

來源 | 北京大學融媒體中心、北京大學校友工作辦公室

 

編輯 | 張祺祺

 

圖片 | 受訪者提供、朱成軒

 

排版 | 王俊曄

 

責編 | 戴璐瑤 

來源:北京大學