- 相关推荐
语料库语言学
语料库语言学
【摘要】语料库是语料库语言学研究的基础资源,也是经验主义语言研究方法的主要资源。
语料库分为很多类型,现在已有相当数量的语料库可供语言研究使用。
语料库语言学作为语言学的一个新的分支,当然离不开语料库。
本文解释了语料库语言学的定义及其内涵,介绍了英语语料库的发展和现状,并对语料库语言学的未来发展进行了展望。
【关键词】语料库;语料库语言学;发展
一、引言
语料库自从20世纪60年代初出现至今,已经经历了半个多世纪的发展。
随着计算机技术的不断进步,语料库的研究已经不再是某些人的专利。
同时语料库的发展也正在以惊人的速度对语言研究的很多领域产生着愈来愈大的影响。
语料库语言学,是一种基于语料库的全新的研究技术和方法。
可以毫不夸张地说,语料库语言学开辟了语言研究的一个全新的领域。
本文拟对语料库的建设,语料语言学的研究特点,语料库及语料语言学的发展现状以及存在问题等角度对于语料库及语料语言学进行一次梳理。
二、理论回顾
1.什么是语料库、语料库语言学?语料又称为素材,是自然发生的语言材料包括书面语和口语的集合。
“可以用来作为描述一种语言的出发点或用于证实有关一种语言的假设的手段”(Crystal,1991)。
语料库(corpus)亦称语库,是存放语言材料的仓库。
语料库是收集并科学地组织起来的语言材料数据库,这种材料是某种语言中自然出现的,可以是书面的,也可以是口头的(申厚坤,2005)。
通常地讲,语料库就是指为语言研究收集的、用电子形式保存的语言材料,由自然出现的书面语或口语的样本汇集而成,用来代表特定的语言或语言变体。
2.语料库及语料库语言学的的产生与发展。
有人认为语料库研究的发展经历了三个阶段:运用语料库进行语言研究最早可以追溯到19世纪末,当时的研究手段还只停留在卡片制作和人工检索的阶段,其成果也仅用作编纂语法书或词典的参考。
20世纪60年代至90年代是语料库语言学发展的第二个阶段,世界各地都开始建设自己的语料库并且开始跨国联合建立国际性的语料库。
20世纪90年代中期是语料库语言学发展的第三个阶段。
但现在被研究者普遍认同的是参照乔姆斯基转换生成语言学的兴衰,认为语料库语言学经历了早期发展、新发展与复兴三个阶段。
3.语料库语言学的研究意义。
语料库语言学采用数据驱动的实证主义研究方法对自然语言进行统计分析。
对语言、语言交际和语言学习的行为规律进行多层面和全方位的研究。
使语言研究不仅只是对单纯语言学上的符号的描述和解释,还是对蕴涵着的复杂社会因素和深刻文化意义的描述和解释。
4.语料库语言学的现状。
语言界越来越多的人意识到语料在语言研究中的巨大作用。
大批语料库的建成极大地促进了基于语料研究项目的迅速开展。
语料库语言学也正在一起不可替代的巨大优势在语言学研究中发挥着越来越无法替代的重要作用。
语料语言学在以下各方面正被广泛地运用着。
①语料库语言学与词典编撰。
语料库语言学对于词典的编撰无疑具有极其重要的作用。
稍加留意就可以发现,当代一些对外语教学有着重要影响的词典和语法书均是在语料库的基础上编写的。
SEU语料库建成后,Quick等人合编了堪称权威之作的《当代英语语法》(A Grammar of Contempor-ary English),并根据充实了的语料库合编了更具权威的《英语语法大全》(A Comprehensive Grammar of the English Language)。
COBUILD语料库也以其庞大的库容、多样的内容作为词典编纂不可缺少的工具。
②语料库语言学与语言研究。
我们无法否认这样的事实:任何和语言现象有关的研究都离不开真实的语言素材。
语料库为应用语言学的研究提供了丰富的语言材料。
语料库语言学使得在语言理论、语言史研究和句法、词法分析及自动语法分析方面得到了充分的应用。
再加上语料库的检索功能和统计手段给句法研究、语篇分析、会话分析和语音研究提供了方便。
互联网上现代英语国际电脑文档(I2CAME)介绍了许多近年来以语料库为基础的语言研究项目,说明语料库对于语言研究的重大意义。
A.语料库语言学与外语教学。
毫不夸张地说,语料库和语料库语言学的应用已经渗透到语言教学的各个角落。
许智坚将语料库语言学在外语教学中的应用总结为如下六点:a.帮助减少课堂上教的与人们实际上正在使用的语言之间的差距;b.发现过去被忽略的语言规律;c.帮助我们更清楚地认识各种语域变体的特点;d.帮助我们更准确地理解一些词语在实际交际中的意义和用法;e.帮助发现学习者使用语言时的问题;f.测试及语言错误分析等方面。
在计算机辅助教学中语料库语言学能在教学中发挥更大的作用。
B.语料库语言学与翻译。
语料库语言学与翻译的结合起步相对较晚,至今只有十多年的历史。
两者的结合源于国外对翻译学的研究。
应用于翻译中的语料库多是平行语料库,由相对应的两种或多种语言构成的文本组成。
③语料库语言学的其他运用。
此外,语料库语言学也在其他一些领域起了一定的作用,比如有力地推动了计算机语言学的发展,主要表现在语料处理工具的研究、机器翻译及话语识别和话语合成等方面。
5.语料库语言学存在的问题。
①语料库语言学的地位问题。
语料库语言学的地位到底怎么定义,这一直以来有些争议。
尤其是语料库语言学被引进中国以来,这种地位问题的讨论就一直没有停止过。
刘满堂、潘永樑等人所持观点为:语料库语言学是一门新兴而独立的语言学分支学科。
黄昌宁、丁信善、许家金等人则持相反观点。
他们甚至提出用基于语料库的研究方法可能更适合于反映语料库语言学的地位和性质。
②语料库建设的问题。
收集语料时的文本形式、文本所有权和版权等的问题也不容忽视。
再加上不同语料库的注释采用的编码系统不完全相同或很不相同,为信息交换和基于语料库的语言研究带来很大的困难。
另外,机器可读语料库中的语篇仍有版权限制,还有语料的时限问题,这些都是语料语言学进一步发展所必须面对的问题。
③语料库语言学的发展问题。
李文中(2010)指出语料库语言学的发展至少有如下四个问题亟待解决:A.语料库开发问题。
语料库开发正在向两头快速发展和延伸:一是通用型的、基于网络的超大型语料库开发;二是个性化、专门化、行业化的小型语料库开发。
这两种开发的方向各有其优势,到底哪种开发方向应该占据优势,还是两种发展方向各自为战,又亦或是两者相结合发展,确实也是需要考虑的问题。
B.语料库研究的发展问题。
语料库研究需要更大的发展纵深,要解决如何从描述到解释,以及如何从发现到理论建构等难题。
C.语料库研究方法和视野问题。
语料语言学是集中于实践性研究,偏废理论建构式的研究,还是也需要在理论建构上有所建树?研究的视角仅仅局限于教学和语言习得,还是不断的拓展其研究领域以扩大其影响力?这也是问题。
D.语料库研究应用问题。
语料库研究应用越来越多元化和日常化。
到底如何将语料库的研究成果更加充分的应用起来,应该引起足够的重视。
但目前最大问题可能是只有一小部分语言研究专家掌握语料库研究方法,绝大多数语言教师和语言学习者不了解语料库,不会使用语料库,更不懂如何运用语料库资源进行科学研究。
三、结语
近几年来在计算语言学和语言信息处理领域的学术会议上,语料库的建设和应用一直是重要论题之一。
纵观其讨论的重点主要集中在基于语料库的语言分析方法,以及语料的标注、管理和规范等问题上。
语言学家更多关心的是语料库的规划和建设,语料库方法在语言研究和教学中的应用。
(傅爱平)现阶段,语料库主要用于语言描写,为词典编纂、教材编写、语言教学提供实际语例,帮助语言学家揭示语言的词汇、语法、语义和语用规律。
我们坚信,语料库语言学将会广泛地应用于语言学研究的各个领域,不仅仅为外语教学、词典编纂、教材编写等开辟新的道路,更会在其他不同的更为广泛的应用语言学的领域里大放光彩。
参考文献:
[1]丁信善.语料库语言学的发展及研究现状[J].当代语言学.北京:1998(1)4-12.
[2]桂诗春.发展我国应用语言学的几点想法[J].语言文字应用.北京:1998(1):11.
[3]何安平.学习者语料库与外语教学[J].国外外语教学,1999(4).
[4]冯志伟.中国语料库研究的历史与现状[J].汉语语言与计算学报,2002(1).
[5]顾曰国.语料库与语言研究当代语言学[J].1998(1).
【语料库语言学】相关文章:
认知语言学的语言学基础论文范文10-05
英语语言学论文11-14
网络语言的社会语言学10-26
c语言学习心得11-05
中班语言学科工作总结11-19
语言学期工作总结01-07
关于新西兰语言学习技巧简介10-07
中班语言学好样教案反思10-07
意大利语言学习技巧浅析10-07