1月以來,先后在北京AI“新春第一會”和智源研究院“2026十大技術(shù)趨勢”發(fā)布會上攜最新成果亮相,光輪智能聯(lián)合創(chuàng)始人、總裁楊海波“很忙”。
忙碌的背后,是2025年具身智能賽道爆發(fā)式增長,但訓(xùn)練數(shù)據(jù)短缺的現(xiàn)狀。在這一背景下,2023年成立的光輪智能以具身智能背后“賣水人”的身份脫穎而出,其專注的AI仿真合成數(shù)據(jù)服務(wù)精準(zhǔn)填補了這一市場缺口。目前,超過80%的國際主流具身智能團隊的仿真資產(chǎn)與合成數(shù)據(jù)來源于光輪智能,世界模型團隊與多模態(tài)模型團隊也是他們的客戶。
2026年1月的一個晚上,楊海波接受了新京報貝殼財經(jīng)記者的專訪。之所以選擇在晚上,是因為創(chuàng)業(yè)近三年來,他始終保持高強度、多線程的工作節(jié)奏:每天清晨集中處理來自全球團隊的大量信息,他稱之為“清圈”(即清理未回復(fù)的微信信息),之后持續(xù)跟進重點事項進展,并與客戶、政府和投資機構(gòu)進行密集溝通,日均安排4至5場會議。
楊海波向記者坦言,光輪智能成立初期主要面向自動駕駛領(lǐng)域,但具身智能火爆后,其數(shù)據(jù)需求量至少是自動駕駛的1000倍。在他看來,只有AI仿真數(shù)據(jù)才能提供具身智能企業(yè)們渴求的“規(guī)模化數(shù)據(jù)”,“未來機器人和智能體會像今天的手機、汽車一樣,廣泛應(yīng)用于各個行業(yè)和城市角落,背后必然需要可靠的數(shù)據(jù)支撐,而這種支撐依賴于基于仿真的科學(xué)能力?!?/p>
以下為貝殼財經(jīng)記者與楊海波的對話。

光輪智能聯(lián)合創(chuàng)始人、總裁楊海波。會議主辦方供圖
為什么具身智能卡在數(shù)據(jù)上?仿真正在成為破局關(guān)鍵
新京報貝殼財經(jīng):AI仿真合成數(shù)據(jù)這一賽道,是光輪智能在2023年成立之初就已經(jīng)明確瞄準(zhǔn)的,還是隨著近年來多模態(tài)等技術(shù)突破逐步拓展出的新業(yè)務(wù)方向?
楊海波:客觀來說,公司從成立第一天起就明確聚焦于仿真合成數(shù)據(jù)賽道。我們的關(guān)注重點并不在于某一種具體的機器人形態(tài),而在于物理AI所必需的數(shù)據(jù)基礎(chǔ)設(shè)施建設(shè)。當(dāng)時我們觀察到,大語言模型的發(fā)展得益于互聯(lián)網(wǎng)長期積累的大規(guī)模文本語料,而物理世界所需的三維與物理數(shù)據(jù)幾乎處于空白狀態(tài),這為合成數(shù)據(jù)提供了重要的發(fā)展機遇。
AI要真正進入物理世界,無論是機器人、自動駕駛,還是各類自動化設(shè)備,都必須依賴可規(guī)?;?、可持續(xù)、可跨場景的數(shù)據(jù)供給體系。然而,真實世界數(shù)據(jù)在獲取過程中普遍面臨成本高、效率低以及部分場景存在安全風(fēng)險等問題,難以支撐大規(guī)模訓(xùn)練需求。正是由于真實世界試錯成本高、周期長且風(fēng)險較大,仿真合成成為唯一能夠承載規(guī)模化試錯和訓(xùn)練的技術(shù)路徑。因此,仿真并非事后跟隨行業(yè)趨勢的選擇,而是公司自成立之初便確立的核心技術(shù)方向。
盡管近年來多模態(tài)能力的提升顯著改善了仿真的效率、真實度和視覺表現(xiàn),但在物理層面,受力、接觸、形變、材質(zhì)以及摩擦等關(guān)鍵要素,仍然必須通過高精度仿真來實現(xiàn)。仿真的核心難點并不在于畫面是否逼真,而在于力學(xué)層面的物理準(zhǔn)確性及其在實際訓(xùn)練中的可用性,這也是其與傳統(tǒng)仿真或純視覺模擬的本質(zhì)區(qū)別。
新京報貝殼財經(jīng):合成數(shù)據(jù)與仿真領(lǐng)域的整體市場格局如何?目前這一市場是否仍處于藍海階段?
楊海波:2023年創(chuàng)業(yè)之初,關(guān)注合成數(shù)據(jù)的公司并不多,當(dāng)時行業(yè)還在討論“要不要用合成數(shù)據(jù)”?,F(xiàn)在,所有具身智能和物理AI團隊都認可合成數(shù)據(jù)的重要性,行業(yè)討論的焦點變成了“怎么做好合成數(shù)據(jù)”。
我們進入行業(yè)早、技術(shù)積累深,判斷合成數(shù)據(jù)做得好與壞,核心驗證標(biāo)準(zhǔn)是客戶選擇。目前全球前三的世界模型團隊都在使用我們的仿真和數(shù)據(jù)服務(wù),超過80%的頭部具身智能團隊的仿真資產(chǎn)和數(shù)據(jù)都來源于我們,市場用實際選擇證明了我們的實力。
新京報貝殼財經(jīng):具身智能行業(yè)火爆后,貴公司所接收到的需求與成立初期相比增長了多少?
楊海波:公司初期客戶多集中在自動駕駛等領(lǐng)域,2024年下半年,世界模型和具身智能的需求開始顯現(xiàn)。最近,具身智能和世界模型領(lǐng)域呈現(xiàn)爆發(fā)式增長。具身智能的大腦模型底層源于世界模型,我們更愿意將其理解為物理AI在物理世界落地的重要載體。
具身智能的數(shù)據(jù)需求量至少是自動駕駛的1000倍。主要有兩個原因:第一,自動駕駛本質(zhì)是“防碰撞的視覺游戲”,沒有復(fù)雜物理交互,而具身智能需要與世界深度交互,比如開冰箱門時感受磁吸阻尼的力,多了物理交互維度;第二,自動駕駛有現(xiàn)成的數(shù)據(jù)回傳和處理體系,而具身智能處于從零開始的階段,沒有現(xiàn)成數(shù)據(jù)供給;還有一個更直觀的理解,具身智能要替代千行百業(yè),應(yīng)用場景遠比自動駕駛廣泛,數(shù)據(jù)需求量自然大幅增加。
新京報貝殼財經(jīng):請問貴公司的定價是主要依據(jù)定制化程度、成本投入,還是最終效果?例如線纜仿真這類難度較高的場景,是否按照訓(xùn)練成本進行定價?
楊海波:合成數(shù)據(jù)的定價主要按小時計價,但具體價格會根據(jù)場景難度、任務(wù)復(fù)雜度、訓(xùn)練規(guī)模調(diào)整,不是單純的成本定價法,更多結(jié)合難度和市場情況。我們希望定價方式清晰透明,因為客戶會將仿真和評測能力納入長期研發(fā)規(guī)劃,我們提供的不只是數(shù)據(jù)文件,更是持續(xù)提升的研發(fā)能力。值得一提的是,高質(zhì)量數(shù)據(jù)極其稀缺,一旦解決了客戶“有無”的核心問題,價格就不再是關(guān)鍵,乙方也將具備更強的定價能力。
讓機器人感受到真實世界,訓(xùn)練仿真數(shù)據(jù)到底難在哪
新京報貝殼財經(jīng):對于稀缺且技術(shù)難度較高的數(shù)據(jù)類型,其訓(xùn)練過程中的主要難點體現(xiàn)在哪些方面?
楊海波:訓(xùn)練過程的核心挑戰(zhàn)在于如何產(chǎn)出高質(zhì)量數(shù)據(jù),主要體現(xiàn)在兩個方面:第一,數(shù)據(jù)底層質(zhì)量要真正對齊物理世界。合成數(shù)據(jù)在實際應(yīng)用中需要與真實數(shù)據(jù)直接競爭,而物理交互的真實性是其中的關(guān)鍵,這一點就擋住了絕大多數(shù)參與者。第二,具身模型的演進會不斷改變對數(shù)據(jù)的需求規(guī)范,這意味著數(shù)據(jù)提供方必須具備很好的算法理解能力,從模型和算法的角度去理解數(shù)據(jù)需求,而不僅僅停留在傳統(tǒng)的數(shù)據(jù)生產(chǎn)或運營層面。這就要求我們既要有數(shù)據(jù)能力,也要有算法能力。
做好合成數(shù)據(jù)需要兩項核心能力:一是確保數(shù)據(jù)的高質(zhì)量,需要長期的底層技術(shù)開發(fā)能力,同時要與頭部客戶共創(chuàng),在0到1的階段將仿真與真實世界的誤差壓到最小,我們服務(wù)了行業(yè)最頭部的客戶,積累了大量寶貴經(jīng)驗;二是規(guī)?;┙o能力,要能穩(wěn)定、持續(xù)生成跨本體、跨任務(wù)的大規(guī)模高質(zhì)量數(shù)據(jù),不能只追求質(zhì)量而忽視規(guī)模,合成數(shù)據(jù)的真正門檻在于質(zhì)量和規(guī)模的兼顧,這是我們多年服務(wù)頭部客戶后形成的行業(yè)認知。
新京報貝殼財經(jīng):光輪智能擁有多種類型的仿真數(shù)據(jù),涵蓋醫(yī)療場景中的臟器、農(nóng)業(yè)場景中的采摘任務(wù)以及工業(yè)場景中的線纜操作等。你們是如何實現(xiàn)仿真數(shù)據(jù)與真實數(shù)據(jù)高度一致的?其中有哪些關(guān)鍵方法或技術(shù)路徑?
楊海波:真實世界重復(fù)訓(xùn)練確實在成本、安全性和效率方面存在問題。為此,我們采用了全棧自研的“求解—測量—生成”三位一體的仿真技術(shù)路線。以線纜插拔為例,這是工業(yè)級的難題,傳統(tǒng)仿真僅將線纜視為簡單曲線、插頭視為簡單碰撞檢測,而我們會在自動化測量工廠中,精準(zhǔn)測量線纜的彎曲剛度、扭曲特性、重量分布,以及插拔過程中的阻力曲線、拔出所需力度、不同角度的卡位點、接觸點摩擦系數(shù)等真實物理參數(shù)。
難點主要有三個:一是計算復(fù)雜度高,線纜不像剛體有固定形狀,它是連續(xù)體,理論上有無限個自由度。要準(zhǔn)確模擬,需要把它離散成上千個節(jié)點,每個節(jié)點都和周圍節(jié)點相互作用,這意味著要實時求解上萬個耦合的非線性方程。傳統(tǒng)方法要么算不準(zhǔn),要么算得慢;二是多物理場耦合,線纜插拔不是單一物理現(xiàn)象,線纜本身是柔性體,涉及大變形彈性力學(xué),插頭是剛體,涉及精密接觸力學(xué);插拔過程有摩擦、有卡位、有形變。把這些不同的物理場統(tǒng)一求解,還要保證實時性,這是世界級難題;三是穩(wěn)定性和精度的平衡,提高精度會導(dǎo)致計算量指數(shù)級增長,過度追求速度則會簡化參數(shù),導(dǎo)致過程失真。
針對上述問題,我們自研了GPU物理求解器,通過GPU并行加速,找到了物理精度和實時計算的平衡點,既能呈現(xiàn)線纜完整的物理狀態(tài),又能在毫秒內(nèi)完成計算。憑借這些技術(shù),我們能規(guī)?;烧鎸崍鼍埃寵C器人在虛擬環(huán)境中真實感受物理反饋,比如插頭插歪時的卡阻、插到位時的卡頓感,這些都是機器人訓(xùn)練迫切需要的。相比之下,傳統(tǒng)仿真更接近于動畫演示,無法實現(xiàn)有效交互。而我們所構(gòu)建的是物理級仿真體系,每一幀背后都有上萬方程支撐,確保虛擬到現(xiàn)實的真實性。
新京報貝殼財經(jīng):在當(dāng)前數(shù)據(jù)規(guī)模不斷擴大的背景下,機器人公司在模型訓(xùn)練過程中,是否可以完全使用仿真數(shù)據(jù)?
楊海波:具身智能的發(fā)展需要規(guī)模化的本體數(shù)據(jù)供給,而仿真合成數(shù)據(jù)是唯一能滿足這一需求的解法。在物理AI體系中,仿真數(shù)據(jù)并非對真實數(shù)據(jù)的補充,而是訓(xùn)練體系的基礎(chǔ)。
總結(jié)來說,真實數(shù)據(jù)負責(zé)對齊現(xiàn)實世界,仿真數(shù)據(jù)負責(zé)模型成長,預(yù)訓(xùn)練、強化學(xué)習(xí)、評測都高度依賴仿真數(shù)據(jù),這已成為行業(yè)的普遍實踐。從供給規(guī)模上看,仿真數(shù)據(jù)的供給量能比真機數(shù)據(jù)跨2到3個數(shù)量級,兩者完全沒有可比性。
新京報貝殼財經(jīng):機器人如果依賴仿真數(shù)據(jù)訓(xùn)練,會不會學(xué)到數(shù)據(jù)中的bug?比如數(shù)據(jù)存在偏差,或者被黑客植入惡意指令,導(dǎo)致機器人在現(xiàn)實中出現(xiàn)誤判,這一風(fēng)險是否真實存在?又該如何應(yīng)對?
楊海波:這其實就是行業(yè)所說的“仿真與真實之間的差異”,是整個行業(yè)面臨的挑戰(zhàn),風(fēng)險確實真實存在。比如仿真中摩擦力參數(shù)預(yù)估偏大,機器人可能會用更小的力抓取物體,導(dǎo)致在真實世界中抓不起來。
我們的應(yīng)對方式主要有三點:從源頭保證數(shù)據(jù)真實性,別人的仿真參數(shù)多基于假設(shè),而我們會通過實際測量獲取不同材質(zhì)、不同溫度下的物理參數(shù),確保測量誤差在1%以內(nèi),從源頭減少系統(tǒng)性偏差;在訓(xùn)練時引入對抗性擾動,比如隨機增減20%的物理參數(shù),讓模型學(xué)會應(yīng)對不確定性,這樣機器人學(xué)會的是“原理”,而不是死記硬背;與頭部客戶持續(xù)迭代,客戶的真實測試結(jié)果就像“體檢報告”,能幫助我們及時發(fā)現(xiàn)并修正問題。
仿真不是100%替代真實數(shù)據(jù),而是“仿真為主、真實為輔”的方案,99%的訓(xùn)練用仿真數(shù)據(jù)完成,剩下1%用真實數(shù)據(jù)微調(diào),既保證效率又確保安全,就像飛機駕駛培訓(xùn),先通過仿真模擬訓(xùn)練,再結(jié)合實際飛行練習(xí),仿真的核心是高效逼近真實,而非替代真實。
當(dāng)機器人走向規(guī)?;抡鏀?shù)據(jù)正在成為底層能力
新京報貝殼財經(jīng):如果未來出現(xiàn)實力相當(dāng)?shù)母偁帉κ?,貴公司更高層面的追求是持續(xù)研發(fā)更復(fù)雜的應(yīng)用場景,還是進一步逼近真實世界的物理精度?
楊海波:核心是多樣復(fù)雜場景的生成能力,因為我們本質(zhì)上是構(gòu)建一個可被學(xué)習(xí)的物理世界。這需要三個層面的努力:首先是在資產(chǎn)層面實現(xiàn)“看得見和摸得實”,讓零部件、工具等在視覺和物理上都足夠真實,比如不同材質(zhì)的夾爪、不同硬度物體的力反饋都要精準(zhǔn);其次是在場景層面實現(xiàn)高度還原,要構(gòu)建工廠、倉儲、家居等復(fù)雜環(huán)境,應(yīng)對動態(tài)變化、光照遮擋等情況,比如窗簾開關(guān)帶來的光照變化都要真實模擬;最后是在任務(wù)層面不斷豐富,要設(shè)計裝配公差控制、異常情況處理、長程任務(wù)多步規(guī)劃等多樣化任務(wù)。面對競爭,本質(zhì)是要在更多樣的場景下實現(xiàn)更高精度的物理交互,提升場景自由度、接觸復(fù)雜度和穩(wěn)定性要求。人形機器人的難點不在于外形,而在于全身物理協(xié)同,這需要依賴復(fù)雜多樣的物理信息才能實現(xiàn)。
新京報貝殼財經(jīng):您如何看待光輪智能自身的發(fā)展前景,以及整個行業(yè)的長期走向?
楊海波:用一句話定義光輪智能,就是“基于仿真技術(shù)打造物理 AI 時代的數(shù)據(jù)基礎(chǔ)設(shè)施”。未來機器人產(chǎn)業(yè)規(guī)?;涞?,最缺的不是概念,而是可訓(xùn)練、可驗證、可復(fù)現(xiàn)的數(shù)據(jù)體系,誰能將仿真和數(shù)據(jù)做成基礎(chǔ)設(shè)施,誰就能真正支撐物理AI的落地,這是我們的定位。
技術(shù)層面,我們會持續(xù)深耕全棧自研仿真,從自動化物理測量、物理屬性庫、高精度物理解算器,到場景和任務(wù)的“真實到仿真”生成能力,不斷完善技術(shù)平臺。行業(yè)層面,物理AI一定會從工具階段走向基礎(chǔ)產(chǎn)業(yè)階段,未來機器人和智能體會像今天的手機、汽車一樣,廣泛應(yīng)用于各個行業(yè)和城市角落,背后必然需要可靠的數(shù)據(jù)支撐,而這種支撐依賴于基于仿真的科學(xué)能力。我們希望光輪智能不僅能成為一家成功的企業(yè),還能在中國物理AI賽道的長期競爭中,貢獻一套可復(fù)用、可持續(xù)演進的基于仿真的底座能力,這是我們的使命。
新京報貝殼財經(jīng)記者 羅亦丹 實習(xí)生 郭雯華
編輯 王進雨
校對 柳寶慶