基于信息碎片化传播背景下的濒危语言档案采集研究

时间:2023-04-19 18:55:04 手机站 来源:网友投稿

摘 要  语言多样性是人类最重要的遗产,每一种语言都蕴藏着一个民族独特的文化智慧。随着社会和经济的迅速变革,语言时空接触暴增加速了地方语言的演变,越来越多的语种濒临灭绝。另外,随着碎片化信息传播的兴盛,互联网环境下的语言多样性问题也日益突出。因此,及时地采集并保存濒危语言档案势在必行。本文在碎片化信息传播背景下,通过分析比较国内外典型语言档案采集方式,以期探索更为精准高效的语言档案采集方式。

关键词  信息碎片化 语言档案 档案采集

中图分类号 G272.2 文献标识码 A 收稿日期 2018-09-26

Abstract Linguistic diversity is the most important heritage of mankind, and each language contains unique cultural wisdom of its nation. With the rapid change of society and economy, the increase of time and space contact of languages has accelerated the evolution of local languages, and more and more languages are on the verge of extinction. In addition, with the spread of fragmented information, the problem of language diversity in the Internet environment is becoming more and more prominent, so it is imperative to collect and preserve endangered language archives in time. In the context of fragmented information spread, this paper analyzes and compares the collection methods of typical language archives at home and abroad in order to explore the more accurate and efficient way of collecting language archives.

Keyword information fragmentation; language archives; archives collection

中国拥有56个少数民族,除满族和回族已使用通用汉语外,其他民族都有自己的语言,有些民族内部的不同支系还使用着不同的语言。中央民族大学教育学院院长苏德毕力格教授表示,中国少数民族语言中的濒危语言大概是17种,强势语言正在借助科技手段不断地挤压弱势语言的使用空间,这是一个全球性问题[1]5。因此,传承和发展少数民族语言文字和文化,成为中国保护语言多样性的关键工作。2008年,国家语委启动了中国语言资源有声数据库的建设工作,全国各地相继启动方言有声数据库的资料采集工作。

一、信息碎片化传播背景下语言档案采集特点

信息碎片化传播是当前信息传播的一种典型样态,主要是指完整的信息通过微博、微信等自媒体的再加工和传播而呈现的零碎的、分散的描述形式[2]1。信息碎片化传播的即时性和交互性,大大加快了信息更新、传播以及阅读的速度,为语言档案的传递、阅读和交互演变成随时随地的行为模式提供了可能性。但信息碎片化传播导致的信息不完整往往会影响接收者的思考和判断,并且带来知识体系的缺陷,这势必会加快一些弱势语言的灭绝,破坏语言的多样性。

信息碎片化传播映射到语言档案的采集上,使之呈现出新的特点,具体体现如下。

采集内容碎片化。语言档案采集内容包括字音、词汇、语法句子以及歌谣、民间故事、口传文化内容等,内容庞杂且标准不统一,因此采集内容片面、零散,缺乏连贯性特点凸显,语言档案也充满跳跃性和随意性。例如,要探寻地方方言的语法、发音、词语等规律,需要通过众多短句来体现。

采集时空的碎片化。语言应用的连续性和相对稳定性决定语言档案采集不是一蹴而就的,定义濒危语言热点地区,采集不同时期的语言档案素材,捕捉语言档案历史演变轨迹,才能完整组成地方语言档案库。同时,语言档案采集耗时长且没有一个机构可以存储所有目前濒危语言的所有重要数据,这也是语言档案采集时空碎片化的又一表现。

采集对象的碎片化。为采集有代表性的濒危地方语言档案,需要通过典型性分析来选择正确的档案采集对象,因此年龄、性别、教育和生活环境等因素都要纳入考虑范畴。因此,一条相对完整的语言档案信息往往凝结着数十位甚至上百位采集对象的有效综合。例如,澳大利亚由档案工作者、研究者以及原住民社区代表借助Web2.0特性的平台共同打造的原住民口述记忆档案系统项目,用多人参与模式来形成、描述和利用档案[3]1。

信息碎片化传播衍生出新的传播媒介,如网站、APP、各类数据库等,人们通过网络传媒,了解、阅读与以往相比数量更加巨大,人们能够花费更少的时间,获取自己想要的信息,同时也为语言档案采集方式提供了新的选择。

二、國内外语言档案采集项目描述

本文选取两个国外典型项目、一个国内项目进行描述分析。

1.数据库归档——欧洲濒危语言记录项目(Endangered Languages Documentation Programme,ELDP)。它是当今世界上参与规模最大、涉及人员范围最广、语种采录数量最多、存储内容最丰富的语言资源保护工程之一。旨在利用高科技手段,典藏全球极度濒危语言,从濒危语言概念界定到技术规范、调查记录、研究方法、典藏手段等,著述了濒危语言资源保护的创新路径,为全球语言资源保护典藏提供了重要的理论和实践参考[4]51。ELDP项目成果主要包括:濒危语言地图、濒危语言项目目录、濒危语言画廊和濒危语言音频、视频记录[5]1。它面向全球开放,是当今世界上参与规模最大、涉及人员范围最广、语种采录数量最多、存储内容最丰富的语言资源保护工程之一。

同类型的数据库项目还有E-MELD(濒危语言数据电子元结构)项目(2001)。该项目是由美国国家科学基金会资助的一个为期五年的项目;LD&C(Language Documentation & Conservtion,LD&C)[6]1语言记录和保存项目隶属于夏威夷大学语言学系。

这类项目的特点是专业性较强。项目参与人通常是语言学家、人类学家、专业档案收集专家,且事先受到专业的理论和技术培训。项目成果包括收集、保护濒危语言数据和文件,并帮助建设有效的电子档案馆;同时记录语言学家利用开发工具、存档标准和工作流程,以及具有关于语言数据收集和分析所需的新技术。

2.在线归档——濒危语言项目(ELP)。濒危语言项目(ELP)项目是语言多样性联盟与谷歌合作开展的项目,用户可以直接通过在线形式查找、共享和存储有关濒危语言的档案。使用网站页面的分类按钮,可以轻松地搜索资源信息、学术出版物和关于世界濒危语言的研究。此项目资源包括人类学、社会学、教育学、认知科学、环境科学、公共政策等方面的信息,并被用户和研究人员上传。访问用户有濒危语言的资源或样本,可在页面顶部使用“提交”按钮上传论文、演示文稿、链接、录音等[7]1。

同类型的项目还有加利福尼亚大学伯克利分校的比较班图在线词典(CBOLD):http://faust.linguistics.berkeley.edu/CBOLD/info.html;宾夕法尼亚大学的语言数据联盟:http://.

[8]https://baike.baidu.com/item/中国语言资源有声数据库/9088483?fr=aladdin.

[9]参见中国语言资源数据库(江苏库),http://yyzy.jsjyt.edu.cn/art/2011/4/20/art_2824_12203.html.

[10] 许鲜明,陈勰,白碧波.欧美濒危语言研究及其对中国语保工作的启示[J].语言学研究,2017(1):25-33.

★基金项目:广东省档案局科研项目(YDK-180-2017)。

★作者简介:李玉嵩,东莞理工学院城市学院综合档案室副主任,档案馆员,硕士研究生,研究方向为档案管理、档案宣传;胡建慧,东莞理工学院城市学院,硕士研究生,研究方向为语言采集与利用;吴娜,东莞理工学院城市学院,硕士研究生,研究方向为公共管理。

推荐访问:濒危 碎片 采集 传播 语言

版权声明 :以上文章中选用的图片文字均来源于网络或用户投稿 ,如果有侵权请立即联系我们 , 我们立即删除 。