新京報貝殼財經(jīng)訊(記者羅亦丹)10月14日凌晨,螞蟻集團(tuán)正式推出萬億參數(shù)思考模型Ring-1T,并全面開源模型權(quán)重、訓(xùn)練配方。Ring-1T在9月30日開源的預(yù)覽版Ring-1T-preview基礎(chǔ)上,持續(xù)擴(kuò)展大規(guī)??沈?yàn)證獎勵強(qiáng)化學(xué)習(xí)(RLVR)訓(xùn)練,進(jìn)一步激發(fā)萬億基座的自然語言推理能力,并通過 RLHF 訓(xùn)練完善模型通用能力,在各項(xiàng)任務(wù)榜單上表現(xiàn)更加均衡。


據(jù)百靈團(tuán)隊(duì)透露,Ring-1T模型是其在萬億思考模型上的首次嘗試,螞蟻百靈團(tuán)隊(duì)會在后續(xù)的版本中繼續(xù)完善模型性能。目前,用戶可通過HuggingFace、魔搭社區(qū)下載模型,并通過螞蟻百寶箱等平臺在線體驗(yàn)。


據(jù)了解,截至目前螞蟻百靈大模型已經(jīng)發(fā)布18款模型,已形成從160億總參數(shù)到1萬億總參數(shù)的大語言模型產(chǎn)品矩陣,其中兩款萬億參數(shù)模型——萬億參數(shù)通用大語言模型Ling-1T、萬億參數(shù)思考模型Ring-1T。隨著兩款萬億參數(shù)模型的發(fā)布,百靈大模型也正式步入2.0階段。


編輯 楊娟娟

校對 陳荻雁