新京報訊(記者楊菲菲)12月16日,在北京大學(xué)語言學(xué)實驗室成立100周年之際,中華民族語言文字接觸交融大數(shù)據(jù)模型正式發(fā)布,有聲博物館項目也正式啟動建設(shè)。


“語言是一個社會性的行為,它和社會形態(tài)的發(fā)展密切相關(guān)?,F(xiàn)在我們提出來中華民族語言共同體意識,語言是一個非常重要的基礎(chǔ)?!北本┐髮W(xué)語言學(xué)實驗室主任、中文系教授孔江平表示,團隊在田野調(diào)查中對120個語言點進行了語言基本信息、文字活力、語言活力、語言詞匯演化、語言認(rèn)同等多項調(diào)查。


北京大學(xué)語言學(xué)實驗室主任、中文系教授孔江平在現(xiàn)場進行分享。新京報記者 李木易 攝


據(jù)悉,2021年12月,北京大學(xué)語言學(xué)實驗室獲批教育部哲學(xué)社會科學(xué)實驗室,在教育部經(jīng)費的支持下,北京大學(xué)語言學(xué)實驗室于2022年春啟動了“中華民族語言文字接觸交融大數(shù)據(jù)模型建設(shè)“項目。項目組織國內(nèi)12所大學(xué)和科研機構(gòu)的約20名專家的研究團隊,近200名博士生和研究生,對中華民族語言文字接觸交融進行了大規(guī)模的田野調(diào)查,歷經(jīng)四年,初步完成了基礎(chǔ)的調(diào)查工作和大型數(shù)據(jù)庫建設(shè)。


調(diào)查發(fā)現(xiàn),與人們普遍認(rèn)知的“要么說普通話,要么說民族語言”不同,民族語言正在不斷融入國家的通用語言??捉浇忉?,語言是人類文明的基石,也是思維的工具、文化的載體,在公共社會場合,漢語普通話的使用在不斷增加;家庭依然是民族語言的使用高地。


同時,研究團隊還開展了基于有聲文化的中華民族共同體意識研究。孔江平解釋,團隊采用人工智能的方法,建設(shè)基于演化的中華民族有聲文化大型數(shù)據(jù)庫,建設(shè)中華民族優(yōu)秀有聲文化“基因庫”,構(gòu)建利于了解研究中華民族情感認(rèn)同的大數(shù)據(jù)模型。


此外,孔江平團隊也借助中華民族語言文字接觸交融大數(shù)據(jù)模型對語言學(xué)基礎(chǔ)研究有了更多的探索。


“語言的產(chǎn)生,特別是聲音的出現(xiàn),一直是國際語言學(xué)研究的難題?!笨捉奖硎荆b于現(xiàn)在有頭蓋骨和下頜骨的古人類化石數(shù)量和年代受限,并不能構(gòu)建出人類聲音的完整演化過程??捉綀F隊將黑猩猩的聲道和人類的聲道進行擬合,并合成聲音,致力于發(fā)現(xiàn)人類語音的涌現(xiàn)規(guī)律。


讓沉睡在田野中的、即將消亡的聲音活起來、傳承下去,中華民族語言文字接觸交融大數(shù)據(jù)模型將發(fā)揮重要作用。


孔江平介紹,目前國家已經(jīng)開展了多期“語?!惫こ蹋涗浟舜罅空Z言文字,也有很多珍貴的資料,但在工業(yè)革命時期人類往城市遷徙以后,很多語言的生態(tài)消失了,很難找到將語言保留下來的方法。大模型的出現(xiàn)給語言保護提供了新的可能?!拔覀儸F(xiàn)在嘗試做了一個機器翻譯系統(tǒng)和一個語言合成系統(tǒng),從理論上來講,哪怕一種語言消失了,我們只要給出相應(yīng)的漢語,那系統(tǒng)就會自動生成對應(yīng)的語言?!?/p>


北京大學(xué)語言學(xué)實驗室成立一百周年系列活動啟動,有聲博物館項目建設(shè)同步啟動。新京報記者 李木易 攝


當(dāng)天,有聲博物館項目也在北大啟動。根據(jù)規(guī)劃,有聲博物館未來將設(shè)置歷史分館、現(xiàn)代社會分館、自然分館、動物分館、聲律分館、格律分館、曲律分館、樂律分館、語言障礙分館等。


資料顯示,北京大學(xué)語言實驗室前身是“北京大學(xué)語音樂律實驗室”,創(chuàng)辦于1925年,創(chuàng)始人為劉復(fù)(字半農(nóng))。這是中國成立最早的語音學(xué)實驗室,是北大人文歷史的重要篇章,也標(biāo)志著中國現(xiàn)代語音學(xué)研究的開端。


編輯 繆晨霞

校對 柳寶慶