齐鲁网·闪电新闻4月1日讯近日,教育部、国家语委、中央网信办共同印发了《关于加强数字中文建设 推进语言文字信息化发展的意见》,对加快推进以信息化促进语言文字事业高质量发展,以数字化赋能语言文字更好服务现代化建设等,作出了全面部署。教育部在3月31日举行的新闻发布会上对文件进行全面解读,介绍了全面推进语言文字信息化发展有关情况。
教育部语言文字信息管理司司长刘培俊在介绍推进语言文字信息化发展和数字中文建设有关情况时表示,党的十八大以来,我国语言文字信息化建设持续加强,有力服务科技自立自强。大幅度扩充语言文字信息处理技术标准。会同有关部门推动研制并发布了《信息技术 中文编码字符集》等国家通用语言文字和民族语言文字信息化规范标准100多项,为自然语言处理技术在人工智能、数字产品和信息产业领域的应用创新奠定规范基础。
清华大学、北京大学、哈尔滨工业大学等开展了语言文字信息技术的深度研发,促进中文信息互联互通。其中,北京大学王选计算机研究所建成了中华精品字库。大规模构建语言资源体系。建成了世界最大规模的语言资源库和中国语言资源知识图谱,多模态集成120多种语言和方言资源。大领域布局大语言模型技术应用,聚焦关键领域的需求,试点建设了一批自主安全可控的大语言模型。其中,北京师范大学古汉语大语言模型等已上线。
高水平开展普通话水平测试,全面实现从人工到智能的普通话测试方式转变,制发电子证书9000多万份。广东省建成全国首个普通话水平测试智慧考场。高标准建设语言学习资源。开通国家智慧教育平台语言服务栏目,建成国家通用语言文字学习平台,汇聚8000多项学习资源,打造中华经典资源库、中小学语文示范诵读库等。高起点规范数字空间语言文字,发布《信息技术产品国家通用语言文字使用管理规定》,规范信息技术产品研发,会同有关部门开展“清朗·规范网络语言文字使用”专项行动。
多领域推动语言文化资源共建共享。建成国家语委媒体语言语料库、冬奥会多语言术语库、公共服务领域译写规范术语库、规范标准课程库等30多项,多渠道打造示范平台。上线国家语言资源服务平台、中国语言文字数字博物馆、中国语言资源博物馆数字展区等。指导各地各校开展云端学习等课程平台。多模式推进传承传播。数字赋能让收藏在博物馆的文物活起来,支持联合开展古文字数字化研究,开通甲骨文数据平台,传承中华优秀传统文化根脉。
数字赋能让书写在古籍里的文字活起来,建成中华思想文化术语数据库,面向国际传播1200多条反映中华民族话语体系中最核心最本质的思想文化术语,并与40多个国家和地区开展多语种数字版权合作。已建成集成化、智能化、国际化的全球中文学习平台,用户超1600万人,覆盖190多个国家和地区,深度化合作建立联盟,中文学习联盟云服务平台提供3万门在线课程,与中外1600多家机构合作,推动实现中文人人、时时、处处可学可用、易学易用。
广角度支持科研攻关。发布汉字简繁文本智能转换系统、大语言模型评测技术等百余项科研成果。广布局设置科研机构。设立中国语言智能研究中心、多语种信息技术研究中心、语言技术与数字经济研究中心等,形成语言科技研发方阵。广联动鼓励成果转化。支持有关高校联合人工智能及信息服务领域头部企业,研发语言翻译、智能语音、大语言模型等产品。
刘培俊表示,经过多年努力,语言文字信息化以应用为导向、以服务为主线,形成了多语种资源广泛开发、多方面技术创新应用、多类型主体共同推进、多维度赋能发挥作用的良好局面,有效服务经济社会高质量发展。为抢抓大语言模型迭代升级新机遇、助力“人工智能+”新行动、回应经济社会发展新需求,《关于加强数字中文建设 推进语言文字信息化发展的意见》明确提出,加强数字中文建设的理念、政策、行动和项目,将数字中文建设作为服务数字中国建设的重要任务和全面推进语言文字信息化发展的突出重点,全方位释放语言文字在经济社会发展中的数据要素价值,着力推进中文数字化与数据中文化,着力推进创新应用与规范安全,着力推进新型中文服务体系构建与语言文字治理体系完善。
《意见》明确两个发展阶段,有序实现2027和2035年语言文字信息化发展目标。第一步到2027年,是以数字中文建设为重点的强基示范阶段,形成语言文字信息化推进机制,推动语言文字信息化规范标准、前沿语言技术、优质语言资源、新型语言服务等基础支撑能力显著增强。第二步面向2035年,是全面推进语言文字信息化发展的深化赋能阶段,推动承载中华文化的中文在全球数字空间、网络空间以及生成式人工智能等关键场景中的使用占比和价值引领作用显著提高,实现我国语言文字信息化整体水平位居世界前列。
《意见》部署三项重大任务,统筹推动技术创新、体系保障和关键赋能落地见效。创新应用自然语言处理、大语言模型、多模态信息处理、知识图谱、语料加工等五项前沿技术,重点服务大语言模型等人工智能技术创新应用“制高点”,夯实国家关键语料基础设施“新基建”。系统建设语言文字规范标准、资源服务、人才培养、协同创新和安全治理五大保障体系,重点提升语言文字信息化的基础能力。统筹实施数字中文服务教育发展、助力科技创新、赋能文化传承、推动产业升级、促进社会进步等五大赋能行动,重点推进语言技术与关键领域需求深度融合应用。
闪电新闻记者 王志芹 北京报道