语言空间信息科学研究中心张勇生教授在《中国社会科学报》发表理论文章

发布时间:2024-05-27浏览次数:13


近日,语言空间信息科学研究中心执行主任张勇生教授在《中国社会科学报》A07版发表理论文章《地理语言学助推语言资源保护开发》。《中国社会科学报》由中国社会科学院主管主办,是中国社会科学领域权威学术类报纸之一。张教授的文章分别从四方面展开了论述:一是语言资源保护开发的重要意义与建设内容;二是加快推进各类语言地图绘制;三是有效整合多种技术;四是建立与完善地理语言学理论与方法。

江西师范大学语言空间信息科学研究中心依托地理与环境学院、文学院、计算机信息工程学院,成立于20227月,主要聚焦于语言学、地理信息科学及人工智能交叉领域,率先在全国提出“语言空间智能”研究方向。中心的主要任务是利用新兴技术促进国家语言资源的科学保护与传承,对语言资源进行深度开发与创新应用,面向公安、消防、应急管理与服务等领域开展系列社会化应用,推动多学科交叉研究与人才培养。中心成立以来开展了多个领域的研究工作并取得阶段性成果,进行了微观语言地图绘制方法的探索与创新,构建了全国首个江西赣方言地理信息系统,在江西方言格局、演变与成因、方言文化知识图谱、语音地域识别等领域也积极开展研究,近期相关成果被《现代语言学》《地理与地理信息科学》等期刊录用。此外,也积极参与各类重大特大项目的申请。

现将文章转载分享(原文链接:https://epaper.csstoday.net/epaper/read.do?m=i&iid=6823&eid=48933&sid=226477&idate=12_2024-05-21):

地理语言学助推语言资源保护开发

语言具有工具性、文化性和资源性等多重属性。近年来,国家和社会各界对于方言的文化性和资源性关注度日益提升。20155月,国家启动“中国语言资源保护工程”(以下简称“语保工程”),旨在全国范围内开展以语言资源调查、保存、展示和开发利用等为核心的各项工作。202111月,国务院办公厅印发了《关于全面加强新时代语言文字工作的意见》,明确指出要“保护开发语言资源”。语言资源的调查、保存、保护及开发等各项工作已成为国家战略需求,这在我国语言文字工作史上具有划时代的意义。

语言资源保护开发主要包括两个层面的建设内容:一是语言资源的调查、记录和保存;二是语言资源的保护传承和创造性开发利用。地理语言学在保护开发语言资源方面具有独特优势。在调查记录方面,地理语言学密集的布点调查契合了“后语保”时代进一步推进语言资源深度调查和研究的发展要求。在保存和展示方面,语言地图起到不可替代的作用。语言地图不仅可以有效保存和展示语言特征,而且通过电子化、信息化手段能够实现永久性保存和展示。在保护开发方面,地理语言学可以有效整合信息科学、大数据、云计算、人工智能等学科研究方法和现代科技手段,为开展多维度、多用途的语言资源深度开发提供可能。可以说,地理语言学对于推进语言资源的保护开发具有不可替代的作用。围绕保护开发语言资源这项核心工作,地理语言学需要在以下三个方面积极作为。

加快推进各类语言地图绘制

加快推进中观、微观语言地图的绘制,进一步推进语言资源的深度调查。从地图区域视野出发,中国语言地图可分为宏观、中观、微观三种类型。宏观地图主要是全国性的分语地图,通常以县为单位布点,如《中国语言地图集》《汉语方言地图集》以及“中国蒙古语方言地图”“中国朝鲜语方言地图集”等。中观地图即大区方言地图,通常以乡镇为单位布点,包括跨省大区方言地图,调查范围通常横跨数个省,如“西北地区汉语方言地图集”等;分省大区方言地图,如“山东省汉语方言地图集”“河南省方言地图集”等。微观地图即区县级地图,通常以乡镇或村落为单位布点,如严修鸿正在编制的“连城方言系列地图”等。

由于中国各地语言情况有所不同,中观、微观地图的绘制需要因地制宜,统筹推进。就调查对象范围而言,对于方言种类比较单一的地区和省份,可直接以全域范围的方言作为调查对象,一些北方省份就属于这种情况。对于方言种类较多、分布情况比较复杂的地区或省份,可以分层、分步实施。即可先绘制分语或分方言地图集,如“广东粤方言地图集”“广东客家方言地图集”“广东闽方言地图集”等。甚至根据调查研究需要,涉及的调查对象分布比较复杂的区域还可以在“分省”“分语”的基础上“分区”开展工作。比如,林春雨在绘制“广东闽方言地图集”前,就先绘制了“广东东部闽方言地图集”。此外,对于调查工作量比较大的方言,还可以在“分省”“分语”的基础上“分项”开展工作,即以“语音集”“词汇集”“语法集”分层、分步实施。总之,调查对象和范围的确定需要根据方言的复杂程度、分布特点、调查研究基础等方面综合考量。

加快推进中观、微观方言地图的绘制,既是对《中国语言地图集》《汉语方言地图集》等宏观地图绘制工作的延续,也是“语保工程”二期对语言资源进行深度调查和开发的需要。《汉语方言地图集》在调查选点上,东南方言按照11点原则进行布点,官话和晋语大概每3—4个县设1个点。“语保工程”总体上也是按照11点的原则进行布点。《汉语方言地图集》和“语保工程”为世界语言资源保护开发提供了宝贵的中国经验和中国模式,是伟大的创举。不过,由于中国幅员辽阔,不仅方言种类多,各方言内部表现也十分复杂。11点的调查模式显然难以全面反映中国语言的面貌,也难以满足后期对语言资源进行深度开发研究的需要。中观、微观地图正好可以在前述两项全国性大工程的基础上,进一步推进乡镇乃至村落一级单位的调查和研究,为语言资源的深度开发提供更为翔实、细致的基础数据。

有效整合多种技术手段

有效整合大数据、云计算、人工智能等方法或技术手段,对语言资源开展多维度、多用途的深度开发。地理语言学具有很强的跨学科性。尤其是在当下国家新文科、新工科建设背景下,地理语言学可以有效统筹大数据、云计算、人工智能等方法或技术手段开展跨学科研究,在语言资源保护开发方面大有可为。

利用地理语言学的特点和优势,可以在以下几个方面对语言资源开展多维度、多用途的开发。一是数字化。可以在传统纸质地图的基础上,进行数字化地图的开发研究。数字化地图能够实现语言数据的永久保存,并具有传统纸质媒介所不具备的展示功能。依托互联网开拓、搭建数字化管理展示平台,可以实现在线展示。数字化地图的建设以数据库为基础,与原始数据进行关联,在很大程度上提升和拓展了语言地图的使用效能。二是智能化。数字化地图可以最大限度与数字技术相结合,打造独具特色的数字展示和体验方式,并在此基础上实现从数字化到智能化的转型。可以将语言的音频、视频数据以及实物图片统筹在一个功能平台上进行关联,利用手机、平板电脑等移动设备进行触控操作,将语言文化资源的展示与体验、教育与研究、分享与传播功能有机结合在一起。对于一些独特的濒危方言文化资源,可以利用虚拟现实技术手段实现场景化、再现化,让人们身临其境地感受和体验各地方言文化的独特魅力。语言文化资源的智能化开发以需求为驱动,重新梳理和构建语言地图的不同要素,提供“语、音、像、物”多元信息交互通道,构建以人为中心的信息传递模式,从而实现语言地图服务、保护和管理的智能化。三是产业化。地理语言学还可以有效统筹地理信息科学、空间信息技术等现代科学技术手段,进行语音识别与语音刑侦技术开发与应用研究,服务国家信息产业发展,发挥地理语言学社会服务的功能。

语言资源保护开发的深度和广度,取决于语言调查的深度和维度。在一定程度上,调查布点越密集,对于语言的数字化开发就越为有利。同时,只有具备高质量的音像图文一体化、多维度语言资源数据,才能为语言地图的数字化、智能化、产业化提供更为广阔的发展空间。所以,语言资源的保护开发也给地理语言学建设提出了更高要求。

建立与完善地理语言学理论和方法

进一步建立与完善地理语言学理论和方法,为精准对接语言资源保护开发提供理论与方法支撑。中国地理语言学研究起步于20世纪40年代,但真正把语言地图作为研究对象并开展大范围的调查研究工作却是21世纪以后的事情。2008年出版的《汉语方言地图集》为地理语言学的调查研究积累了宝贵的工作经验。“语保工程”的调查摄录规范和技术手段也为地理语言学的调查奠定了很好的工作基础。但中国地理语言学在“中观”“微观”研究方面尚处于探索阶段,缺乏可资借鉴的样板经验和理论方法的指导。从仅有的几部已公开出版的中观和微观地图集来看,在调查选点、条目设置以及调查方式手段、绘图技术等方面均处于探索阶段,缺乏基本的标准和规范指引。比如,在调查选点、条目选择等方面,如何与《汉语方言地图集》以及“语保工程”建立有效的关联,各省方言地图如何建立有效的关联;在调查方面,除了进行纸笔调查外,是否按照统一要求进行规范的摄录、拍照工作等。这些都会严重影响后续的开发研究工作,甚至会导致很多领域的开发工作无法有效开展。

中国地理语言学理论和方法的建设需要特别注意以下两个方面。一方面,要立足于中国的语言国情、语言特点和研究传统,开展“本土化”建设。另一方面,地理语言学发展到21世纪,研究方法和手段不断革新,地理信息科学与空间信息技术将语言资源的开发研究工作从传统的语言学框架中解脱出来。尤其是大数据、云计算、人工智能这些新兴融合性技术,为地理语言学的发展以及语言资源保护开发工作打开了新的发展通道,需要地理语言学理论和方法在原有体系框架下及时作出调整和更新,以适应“语言资源”理念下新时代语言科学发展的新要求。只有这样,地理语言学才能更为精准地对接国家语言资源保护开发的各项要求。