“该教孩子说方言吗”“宿舍里最难懂的方言”“四川方言到底有多萌”“一个字代表你的家乡方言”……在微博话题榜上,这些与方言有关的热搜阅读量全部过亿。与此同时,以方言创作并传播的文学、歌曲、影视、综艺等作品也深受大众尤其是年轻人喜爱。比如,热播剧《山海情》中的方言和剧情更加贴合,闽南语歌曲《大田后生仔》在短视频平台的播放量超20亿次。
上述这些用方言表达的具有地方特色的文化现象,统称方言文化,其内涵主要包括两方面:一是具有文化意义和文化价值的方言现象,主要指用方言称说的地方名物,如房屋建筑、日常用具、服饰、饮食等现象;二是具有文化意义和文化价值的方言民俗或艺术,包括口彩禁忌、称谓地名、娱乐游戏、婚育丧葬、祭祀信奉等方言民俗活动,以及歌谣、曲艺、戏剧、吟诵、故事传说等方言文艺活动。
当然,方言并非单纯只指汉语方言,每种语言包括我国少数民族语言内部都可划分为不同的方言;方言文化,也不限于某些特定的语言方言之内,而是根植于铸牢中华民族共同体意识的中华优秀语言文化。近年来,随着语言资源观的兴起,方言文化的内涵也有所拓展,广义上还包括具有特殊文化意义和文化价值的方言,其中最为典型的是濒危方言,有特殊文字或书写传统、有丰富文学艺术传统的方言,与国家稳定和安全相关的关键方言,以及在城镇化背景下变化发展剧烈的大城市方言等。
习近平总书记多次强调,“文化自信,是更基础、更广泛、更深厚的自信,是更基本、更深沉、更持久的力量”。语言是文化的重要载体,每一种语言都蕴藏着独特的文化智慧,在推动文明交流互鉴、保护传承文化多样性等方面发挥着不可替代的重要作用。保护传承方言文化,最适宜的办法是开发应用,通过研发多类型的方言文化产品,提供多种类、多方位的语言服务,满足人民群众语言生活和文化享受的需求,最终实现以应用促使用、以使用促保护、以保护促传承。当前,汇聚了总物理容量达100TB的“中国语言资源采录展示平台”已上线并向社会各界开放使用,可从国家层面规划包括方言文化在内的各类语言资源的开发应用。具体途径有:
一是转写标注海量音视频语料。国家语言资源库拥有第一手语言资源音视频数据1000多万条,需研制转写标注的国家规范标准,指导转写语料的方言直译或民族语言直译(含语素分析)、普通话意译和国际音标,以及开展语料库属性标注,如添加字音中古音和现代语音学信息,词汇的义类、义素、词类、构词法以及句子的句型、句式和语法范畴等信息,唯有如此,才能攻克我国语言因内部差异巨大而造成的识别障碍,让这批珍贵的语料成为语言教学与研究、语言信息处理、人工智能、文化产业等领域的基础资源。值得注意的是,面对音视频语料转写专业性强且需耗费大量人力的现实需求,应鼓励语言学家与语音智能技术专家开展交叉学科研究,对语音识别技术基础较好的大方言(如粤语、西南官话等)开展自动转写技术联合攻关研发,以机助方式完成长篇语料自动断句、部分语料属性的自动标注,初步实现语料直译、意译、国际音标的自动转写。
二是提升国家语言资源库的安全性和共享度。随着语料开放范围的扩大和程度的加深,用户的多样性和复杂性也随之大幅度提高。一方面,应增强资源库安全等级建设水平,加快数据信息加密技术的研究和知识产权保护体系的研制,优化平台管理模式,及时跟进国内外语情与舆情监测;另一方面,鉴于语料的“开放共享”和“无限增长”是国家库具有前瞻性和科学性的重要体现,因此,要加强在线数据更新迭代、勘误审核和分析研讨等功能的研究,以提升核心数据的权威性、准确性、有效性,也要通过“众包”技术增加数据采集点和条目采集量,为仍处于持续濒危状态的方言文化寻找科学保护的新路径。
三是建设网络版中国方言文化博物馆。博物馆是保存、保护、展示、共享方言文化的最佳载体之一。近年来,各级人大和政协的代表委员多次提出与语言博物馆建设相关的提案议案。中国语言资源保护工程已搭建好语言资源大数据“国家库—地方库”的分层架构体系,各地可通过该技术框架构建本地方言文化库,将数据采录展示系统下钻到县级单位,形成“毛细血管”式的平台多级体系。在此基础上,探索利用融媒体平台技术建设网络版中国方言文化博物馆,实现国家馆与地方馆技术互通、资源兼容、信息共享。
(作者:王莉宁,系中国语言资源保护研究中心常务副主任、教授)