讓每個漢字都“活躍”在“云端”——透視我國語言文字信息化“新基建”
http://www.wandqa.cn2025年04月01日 09:14教育裝備網(wǎng)
“由頁”合在一起是“頔”,寓意美好;“韋華”合起來是“韡”,寓意光明盛大……名字蘊含著父母對孩子的期待。
曾經(jīng),這些寓意美好的生僻字,卻因無法在電腦里輸入為當事人帶來許多困擾。從出生建檔、上戶口、辦理身份證、銀行卡到醫(yī)院掛號……數(shù)字時代,我們該如何守護那些被困在信息系統(tǒng)“盲區(qū)”的漢字?
時序更迭,變化悄然而生。“北京大學作為國家語委中文文字字體設計與研究中心的依托單位,設計開發(fā)國家重大基礎性規(guī)范《通用規(guī)范漢字表》的配套字庫,研制人口信息生僻字超大字庫解決方案,在第二代居民身份證、護照上應用,協(xié)助解決銀行、稅務等社會應用系統(tǒng)的人名、地名缺字問題。”北京大學王選研究所所長湯幟說。
近年來,教育部會同有關部門推動研制并發(fā)布了《信息技術中文編碼字符集》等國家通用語言文字和民族語言文字信息化規(guī)范標準100多項。2023年,新版《信息技術中文編碼字符集》增錄1.7萬余生僻字。
這只是語言文字信息化發(fā)展的“冰山一角”。
“語言文字工作是國家綜合實力的重要組成部分,在國家治理和戰(zhàn)略規(guī)劃中具有重要地位和作用。我們充分發(fā)揮語言文字作為信息載體的重要作用,大力提升國家戰(zhàn)略服務能力。”教育部語言文字應用管理司副司長王暉說。
夯實根基,如何讓語言文字賦能中國特色大語言模型技術創(chuàng)新應用?首先讓國家語料基礎設施建設成為當前語言文字信息化發(fā)展的“新基建”。近年來,教育部推動建成國家語委媒體語言語料庫、冬奧會多語言術語庫、公共服務領域譯寫規(guī)范術語庫、規(guī)范標準課程庫等30多項,上線國家語言資源服務平臺、中國語言文字數(shù)字博物館、中國語言資源博物館數(shù)字展區(qū)等,服務國家戰(zhàn)略發(fā)展。
服務群眾,如何讓語言文化優(yōu)質(zhì)資源惠及更多人?教育部推動打造“掌上可學、好玩好學、人人能學”的新時代全民學習新課堂。上線的“中華經(jīng)典資源庫”和“中小學語文示范誦讀庫”被譽為“最好聽的語文”,惠及全國約1.6億中小學生和上千萬教師及社會大眾。
貫通歷史,如何借助數(shù)字化技術讓傳統(tǒng)語言文化火起來?教育部推動中國語言文字數(shù)字博物館建設,在數(shù)字賦能下,書寫在古籍里的文字“活”了起來。支持相關單位聯(lián)合開展古文字數(shù)字化研究,開通甲骨文數(shù)據(jù)平臺,傳承中華優(yōu)秀傳統(tǒng)文化根脈。
面向全球,如何推動語言文化國際交流互鑒?教育部多領域推動語言文化資源共建共享,建成中華思想文化術語數(shù)據(jù)庫,面向國際傳播1200多條中華民族話語體系中最核心最本質(zhì)的思想文化術語,并與40多個國家和地區(qū)開展多語種數(shù)字版權合作。建成集成化、智能化、國際化的全球中文學習平臺,用戶超1600萬人,覆蓋190多個國家和地區(qū)。
令人矚目的成就背后亦不乏高校身影。教育部、國家語委依托高等學校,在全國布局建設了中國語言智能研究中心、多語種信息技術研究中心、語言技術與數(shù)字經(jīng)濟研究中心等語言科技研發(fā)方陣。清華大學、北京大學、哈爾濱工業(yè)大學等高校開展語言文字信息技術深度研發(fā);北京師范大學古漢語大語言模型上線;廣東省教育廳依托廣州大學成立國家語言服務與粵港澳大灣區(qū)語言研究中心,利用語言技術賦能語言服務、語言生活、語言規(guī)劃、語言政策學術和咨詢研究,承建國家語言資源服務平臺……
著眼未來,教育部、國家語委、中央網(wǎng)信辦共同印發(fā)《關于加強數(shù)字中文建設 推進語言文字信息化發(fā)展的意見》。將數(shù)字中文建設作為服務數(shù)字中國建設的重要任務和全面推進語言文字信息化發(fā)展的突出重點,全方位釋放語言文字的數(shù)據(jù)要素價值、全環(huán)節(jié)發(fā)揮語言文字的資源功能作用、全領域推進語言文字服務經(jīng)濟社會發(fā)展,著力推進中文數(shù)字化與數(shù)據(jù)中文化,著力推進創(chuàng)新應用與規(guī)范安全,著力推進新型中文服務體系構建與語言文字治理體系完善。充分發(fā)揮語言文字作為國家重要教育資源、科技資源、文化資源、經(jīng)濟資源、安全資源和戰(zhàn)略資源的功能作用,實施數(shù)字中文服務教育、科技、文化、產(chǎn)業(yè)、社會等重點領域的五項專項行動,助力中文發(fā)揮立德樹人的基礎作用、推進科技創(chuàng)新的支撐作用、傳承中華文化的根脈作用、賦能產(chǎn)業(yè)升級的關鍵作用和服務社會需求的民生作用。
“可以看出,從‘夯實根基’到‘著眼未來’,經(jīng)過多年努力,語言文字信息化以應用為導向、以服務為主線,形成了多語種資源廣泛開發(fā)、多方面技術創(chuàng)新應用、多類型主體共同推進、多維度賦能發(fā)揮作用的良好局面,有效服務經(jīng)濟社會高質(zhì)量發(fā)展。”教育部語言文字信息管理司司長劉培俊說。
本報北京3月31日電