论日语自制写作语料库的构建

时间:2023-04-24 17:05:20 手机站 来源:网友投稿

摘要:语料库对于大学本科日语写作教学有着辅助性的作用。但日本开发的大型语料库及国内现有的日语学习语料库对大学日语写作的教与学缺乏针对性和可用性。教师可利用学生写作素材及写作教材教辅自制小型写作语料库,并引导学生在写作任务的完成过程中加以合理利用。实验证明,自制小型写作语料库能为学生提供更为真实的语言材料,能有效提高日语专业学生写作过程中的词法能力、句法能力、篇章能力及自我修改能力。

关键词:自制语料库;日语写作;词法;句法;篇章法

一、日语语料库的现状

与发展较为成熟的英语语料库相比,日语语料库的建设及相关研究始终相对滞后。日本方面开发的语料库主要有:KOTONOHA「現代日本語書き言葉均衡コーパス」、JpWac-L2「学習者用例文コーパス」、EDR语料库、京都大学语料库、太阳语料库、日本古典文学全文数据库。而针对日语外国人学习者的语料库有寺村秀夫主持建立的「外国人学習者の日本語誤用例の収集·整理と分析」和由日本国立国语研究所建立的「日本語学習者による日本語作文と、その母国語訳の対訳データベース。而中国日语学界开发的语料库主要有中日对译语料库和中国日语学习者语料库CLJC。近年来,语料库被广泛地运用与外语教学理论与实践中,其中,语料库对外语写作教学的帮助也取得了国内外学者的共识。日本学者投野由纪夫、荻野網男、寺嶋弘道、美咲敦子、望月通子等也对日语语料库在语言教育中的作用给予了充分的肯定,如投野(2003)提出语料库在语言教育中的间接运用法与直接运用法,即将语料库运用于教材开发和学习者自主运用语料库进行学习两种方法。寺嶋发展了Tim Johns所倡导的“数据驱动学习法”,即以语料库数据为学习动机驱动的学习方式,美咲(2008)认为学习者若能在使用辞书和语法书的同时使用语料库,那么即使指导者不在也能够自己解决学习疑问。

但笔者认为,现有的日语语料库对中国本科日语专业学生写作能力的培养在存在很大的缺陷,有必要创建专门针对日语写作的语料库,以达到辅助本科日语写作教学的目的。纵观现有的日语语料库,每一个语料库的素材文本都过于单一,如青空文库和新潮文库里所有入选文本均为知名作家的文学作品,EDR语料库和京都大学语料库所有文本均为报纸杂志,国内最大的中日对译语料库也基本只收录了中日著名作家的知名作品,且偏向于小说与散文。这些语料库所采集的文体类型单一,并非严格意义上的均衡语料库。语料库以大量真实的语言作为输入材料的确有利于语言的产出,但“可理解性输入”是一个很重要的习得条件。现有的诸多日语语料库中所收录的文本都大大超出了我国日语初中级阶段学习者可理解与可接收的范围,很难想象日语基础阶段的学习者可以参考原版的日语小说、名家名作、報纸社论新闻评论等并将其词句灵活运用于自己的写作中。而且现有的日语语料库的确均是语篇的简单叠加,缺乏明确的设计理念,存在选择面过窄、类型单一、没有经过系统抽样、缺乏均衡性的问题。结构的不合理、文体的单一化、缺乏良好均衡性和代表性的语料库的都大大限制了其对日语写作教学的辅助作用。

基于以上分析,笔者主张教师可以自建小型日语作文语料库,该语料库专门为日语写作教学量身定制,是教师以学生作文为语言材料构件的学习者语料库。

二、小型写作语料库的制作

(一)数据的收集

笔者收集了14至16年江西师范大学日语系三届大二及大三学生的各类作文,包括作文课上学生所提交的各种体裁的作文、日记、专业四级考试作文、演讲比赛稿等,然后对其进行归类整理。按照随机分层抽样和按比例收集文本的方法,可以确保所获预料的平衡性和代表性。除了从学生的语言使用实例提取文本外,笔者还收集了大量中国和日本所出版的优秀的写作教材、阅读教材如美文诵读、精选晨读等、学生获奖作文优秀作品集,尤其是日本母语使用者中的高中生大学生的写作材料等作为补充。

(二)电脑配置。

数据库的制作需要借助电脑软件来完成。在相应软件安装前需先实现以下电脑配置:1电脑系统设定为Windows® XP以上。在本次课题研究中,笔者使用的是Windows®7系统。2 CPU为Atom,或Celeron,或Core皆可。笔者使用的是Atom。3电脑内存为1GB以上。4在语料库的制作过程中,许多软件的运营都需要Java的支持,所以必须下载并安装最新版的Java。

(三)文本格式转换

笔者所收集的数据基本为WORD文本格式,而语料库制作软件无法识别该种格式文件,所以需要利用批量格式转换软件将文本转换为所需要的TXT纯文本格式。这种文本格式转换软件有很多,笔者使用的是日本「有限会社サイトー企画」开发制作的文本文件的书写和编辑软件「秀丸エディタ」,。

(四)语料的语言处理

步骤(一)中所收集的数据都完整地存入语料库中尽量不进行删除,以保持语言的完整性。但由于格式的不统一书写的不规范会引发步骤(五)中赋码软件的解析错误,必须将每篇文本的标点符号段落格式等进行了统一,将输入过程中的误字、多字、少字等现象进行了处理,清楚了文本中的多余杂质和多余符号。

(五)语言的赋码

首先给每篇文本加注篇头,即标注上文章名、写作者、写作者所在年级班级、文本字数等相关信息。标注的方法是将上述信息分别填入尖括号中并统一放置在文本的开头或结尾处。其次,使用词性赋码软件对文本进行词性赋码。

(六)语料库格式转换

步骤(三)中用「秀丸」保存的文本格式的文件是不能直接用来制作语料库的,必须通过「えだまめ」软件(注:日本国立国语研究所开发制作的语料库数据格式的转换软件)将文本格式的文件转换成语料库软件可以接受的文件格式。

(七)语料的整合

此步骤所使用的是日本国立国语研究所开发制作的全文检索软件「ひまわり」。将上述步骤处理完毕的文本语料一一添加进「ひまわり」,便可以通过关键词对所有语料进行全文检索。这样小型日语写作语料库就制作完成了。该语料库是一开放性的语料库,今后还可根据需要增加新的语料库或删除不使用的旧语料库或建立新的子语料库。

三、自制语料库对日语写作的辅助作用

笔者以江西师范大学外国语学院日语系2013级36位学生为实验对象,分别以北京日研中心的中日对译语料库和笔者自制的小型语料库为基础进行写作教学和写作训练,实验结束后,进行问卷调查和访谈式调查,内容涉及对写作课堂教学的满意度、写作的信心度、写作过程中在词法、句法、语篇、自我修改等方面对语料库的使用情况等。结果显示,学生对自建语料库的满意度要大于对传统语料库的满意度,具体如下表所示。

(一)语料库的实用性和针对性

传统语料库所收集的文本往往大于日语学习者尤其是中级日语学习者的可接受水平,而自制语料库中的料语难易度适中,符合“i+1”的输入原则。自建语料库时可以实时将学生新提交的作文加入语料库中,使得语料库可以不断更新 ,更具有开放性灵活性和时效性。这样,学生亦可以参与语料库的建设,这将大大激发学生的学习热情。

(二)提供真实语言材料

自建语料库是教师利用自己学生的作文为对象自行建立的小型学习者语料库,相比传统语料库,可以为学习者提供更多真实有效的写作材料。教师在写作课堂上可以对自建语料库进行示范性的检索使用,在学生熟悉了语料库的使用后,便可在课后按照写作任务的内容分语域自行收集语料。这样可以慢慢培养学生收集信息的意识,掌握收集第一手资料的方法,对于今后毕业论文的撰写也大有益处。

(三)提高词法能力

“一个内容广泛的语料库就是一座语言真实用法的金矿,而用KWIC(关键词的语境共现)来开发这座金矿就为词汇学习提供了丰富的上下文。(Jones,2001)。学生对写作过程中所需运用词汇的音、形、义及使用场合有任何疑问,都可通过自行检索语料库查找该词语的使用频率、习惯搭配、语域分布、共现语境、使用模式等。由于语料库检索出的目的语是与上下文共现在语境中的,这种语境共现能充分体现该词的真实使用情况及近义词之间的细微差异,故能取得查字典所不能达到的学习效果。字典中,さびしい一词的汉字表记有“寂”与“淋”,很多学生困惑于两个汉字的使用场合。通过引导学生使用语料库搜索关键词“寂しい”“淋しい”,“寂しい”的词频远远高于“淋しい”,“淋しい”的例句均属于情感方面,而对风景等客观的情绪皆使用“寂しい”。这就警示了学生应谨慎使用“淋しい”这一表记,如要表达“走在空寂无人的街道上(人のいないさびしい道を歩く)一义,应选择“寂しい”作为汉字表记。事实证明,依靠词典单个地学习词语使用是低效机械地,利用语料库了解词语的篇内语境能更有效地提高写作过程中学生对词语提取的速度和准确度。

(四)提高句法能力

通过自制写作语料库,学生亦可提高写作句法能力。自制写作语料库将各种句法语法特征在真实的语境中呈现出来,与传统的孤立的脱离语境的语法讲解不同,可以为学生提供真实的句法使用案例。由于写作语料庫中摒弃了会话体的文章,故这些句子都非常适用于写作,且都在学生可理解可模仿可接受的范围内。在语法课和日语概况课上,教师在讲述“する”与“なる”的对立性时往往提到“する”的主观性及“なる”的客观性。但实际上在某些非主观性的动作表达时却有使用“する”的情况。如语料库中收录了一篇讲述母亲怀念儿子的文章,里面有一句“交通事故で息子を死なせた”。显然母亲不可能主观有意识地将儿子致死,此处无意识的表达却使用了“する”而非“交通事故で息子に死なれた”中的“なる”表达,其用意通过上下文的解读我们可以得出:即母亲将自己主动放在加害者的位置,对于本能加以阻止的事态却没有阻止,由此引发儿子交通事故的后悔心情。

(五)提高篇章能力

传统的篇章教学往往是教师给学生提供两三篇该体裁的典型范文,如议论文写作时提出论点给出论据得出结论的三段式写作,这样八股式的教学方式极大束缚了学生的思维。但若将传统语料库作为辅助教学手段导入到语篇教学中,实际又收效甚微。目前许多语料库中所选文章的体裁覆盖面不全,多集中于散文和文学作品,并且由于受作家个人写作风格的影响,往往其文章又不具备该体裁类文章的普遍性的整体特点,所以客观上难以给学生提供参考。而专门针对写作教学的小型自制语料库所选文章基本覆盖了写作教学中所需要教授的全部体裁类文章,归类清晰明确,便于学生查找。每种体裁基本都可以查找到二三十篇以上的文章,每篇文章都有其独特的结构与写法,有助于拓宽学生僵化的思维,不至于千篇一律地写出同一模式的八股文。写作语料库为语篇教学提供了一个平台,丰富且有序的语篇资料给学生提供了足够的空间去分析文章的体裁特征和修辞手段,加深学生对语篇分析的理解,大大提高学生搭建语篇的能力。

(六)自我修改

自建学生作文语料库从语料来源的角度来说属于学习者语料库,而学习者语料库一个很重要的功能就是写作错误分析。学生可以以语料库作为工具,利用语料库检索出于自己所写词句相似的语料进行比对,从而判断自己的表达是否正确和地道。同时,自建语料库在建立过程中就对所有原始学习者语料的错误进行了人工标注,这样完全标注过错误的语料库可以帮助学生发现自己未意识到的错误,警戒自己在写作过程中犯同样类似的错误。更为重要的是,在数据驱动学习中,让学生自己去发现写作中的失误,自己发现问题并解决问题,可以大大提高学生的自主学习能力和学习动力。

四、结论

根据教学实践及教学成果可以得出结论:教师自制的中国日语学习者写作语料库相比大型语料库及其他学习者语料库有更强的针对性、灵活性和实用性,能有效地改善学生写作中所存在的素材单薄、立意浅显、词汇单调、句式混乱、篇章不连贯等各种问题,切实提高写作者的写作意愿,是今后大学日语写作教学改革的一项有益尝试。但写作语料库素材的选择和甄别上如何订立标准、如何在国内高校进行推广,将是今后值得进一步探讨的问题。

参考文献:

[1]于康.语料库的制作与日语研究[M].杭州:浙江工商大学出版社,2013年

[2]赵宏展.小型翻译语料库的DIY[J].北京:中国科技翻译,2007,(5)

[3]毛文伟.日语自动词性赋码器的信度研究[J].上海: 外语电化教学,2012,(5)

[4]张建华,闫腾达.日本語学習者データベースの作成[J].北京:日本学研究,2008

[5]中川正弘.留学生の日本語作文データベース[J].広島:広島大学留学生センター紀要,1999(9)

[6]杨惠中.语料库语言学导论[M].上海:上海外语教育出版社,2002年

推荐访问:语料库 日语 自制 构建 写作

版权声明 :以上文章中选用的图片文字均来源于网络或用户投稿 ,如果有侵权请立即联系我们 , 我们立即删除 。