同样的事物可以按照不同的分类方法将其分出不同的类别,例如人,我们可以按照性别分为男人女人两种,可以按照年龄分为婴幼儿、儿童、少年、青年、中年、老年等,也可以按照职业进行划分,那就太多了。而世界的语言,为了更好的进行研究,专家学者们也将其进行了分类,而现在最主要的分类方法有谱系分类法和类型分类法两种。
世界语言的分类研究起源于欧洲,其中谱系法根据亲属关系、类型法根据同型性划分语言类别。
语言的谱系分类法也叫“发生学分类法”,是德国语言学家奥古斯特·施莱谢尔(August Schleicher)提出来的。他受达尔文的进化论的影响,发明了一种按照植物分类法则对语言进行谱系分类,并按照生物进化树的方式排列各种语言。他提出了语言进化的概念,绘制了语言学里的第一棵谱系树。
对语言的谱系分类,有点类似在一个族群中划分族谱。将每一种语言看做是语言大家庭中的一员,那么若干种语言就存在一个共同的祖先,于是语言学家们就虚拟出了语言学上关于祖语的概念。
祖语(proto-language),又称原始语、原语。指某个语言家族(如语系、语族、语支)的共同祖先,即其一脉相承的古代语言。
语言的分类不像自然科学领域中的分类那样具有刚性,不同的学者有不同的分类标准,但学者们大致按照语门>语系>语族>语支>语言>方言的层级对语言进行系属分类。当然这是很粗略的,目前已被认定的语言系属有上百种,全世界现存的语言约7000种。显而易见,人类肯定是先有口头语言后有文字,人类的先祖们说的是什么口语我们是没办法知道的,故语言系属分类是依据各语言的语音、词汇、语法之间的对应特征推演而来。
下文就对语言系属分类各层级的概念作一个简要的介绍。
一、语门
语门(Language phylum)是语言分类学的一个专属名词,借用了生物学上“门”(phylum)的概念。一般来说,语门都是用来指一些跨越多个语系的语言关系,过去又称为超语系。
现时在语言学专业里提出过的语门有以下几个:
1、亚非语门(Afroasiatic language phylum)
2、南方语门(Austronesian language phylum)Aztec-Tanoan language phylum
3、德内-叶尼塞语门(Dené-Yenesian language phylum)
4、欧亚语门(Eurasiatic language phylum)Hokan language phylum
5、中美州语门(Mesoamerican language phylum)
6、纳-德内语门(Na-Dené language phylum) Penutianlanguage phylum
语门的分类及研究工作是在20世纪末期才开始的,在古老的语言学中,这是一个很新的课题,因此目前存在着较大的争议,通俗些讲就是还不成熟。但为了语言学科知识体系的完善,这是一个有价值的研究方向。
二、语系
语门的下一级分类是语系。在世界语言学界,学者们对语系的分类各自有不同的见解,之间存在着或大或小的差异。这里我们介绍国内学者采用较多的12个语系:
1、汉藏语系(Sino-Tibetan)
以汉藏语系为母语的人口占世界人口的五分之一以上。分布较为集中,以东亚的中国为中心,略向西南辐射。
2、印欧语系(Indo-European)
印欧语系拥有最多的母语人口,是世界上影响力最大,语族最多的语系。地理分布跨度大,范围广。
3、高加索语系(Caucasian languages)
高加索语系分布在位于黑海和里海间的高加索地区和伊朗、土耳其部分地区。(有时高加索诸语被错误地称为是“高加索语系”。其实它们之间几乎没有明显的亲和力。)
4、乌拉尔语系(Uralic languages)
乌拉尔语系是分布于从斯堪的纳维亚往东经乌拉尔山脉到亚洲西北部广大地区的一组语言 。
5、阿尔泰语系(Altaic languages)
阿尔泰诸语是语言学家按照语言系属分类(谱系分类法)方法划分的一组语言,包括了60多种语言。所谓“阿尔泰语系”已经是一个过时的概念。主要分布在中亚、北亚。
6、达罗毗荼语系(Dravidian family)
达罗毗荼语系分布于印度半岛中南部,又名德拉维达语系,斯里兰卡北部和巴基斯坦等地,
7、南亚语系 (Austroasiatic languages)
南亚语系主要分布于中南半岛。约有168种语言被划分在南亚语系,分布在印度、孟加拉、
尼泊尔和中国南部边境。
8、南岛语系(Austronesian languages)
南岛语系是主要由南岛民族所使用的语言,是世界现今唯一主要分布在岛屿上的一个语系,包括约1300种语言。其分布东达南美洲西方的复活节岛,西到东非洲外海的马达加斯加岛,南达
新西兰,北至
台湾岛。其东西的延伸距离超过地球圆周的一半。
9、闪含语系(Semito-Hamitic languages)
闪含语系Hamito-Semitic family(闪米特-含米特语系),又称亚非语系(Afro-asiatic languages)。
圣经说,挪亚的儿子闪是希伯来人的祖先,儿子含是亚述人和非洲人的祖先 ,故称闪含。主要分布在北非到非洲之角、西南亚。
10、尼日尔-科尔多凡语系(Niger-Kordofanian family)
尼日尔-科尔多凡语系是非洲最大的语系。主要是分布于
非洲西部的塞内加尔地区,经过上几内亚高原区到东部的肯尼亚,向南到大陆南端好望角,大概有900种语言。此语系中的所有语言已被语言学家归类为尼日尔-刚果语系语言。
11、尼罗-撒哈拉语系(Nilo-Saharan languages)
尼罗-撒哈拉语系分布于非洲的尼罗河沿岸,尼日尔河沿岸以及非洲中部的撒哈拉地区,包括了中苏丹语族、东苏丹语族、撒哈拉语族、桑海语族、马巴语族等语族。
12、科依桑语系(Khoisan family)
科依桑语系是霍屯督人和布须曼人以及非洲南部其他非班图人使用的一组语言。
三、语族、语支、语言、方言
语族、语支、语言及方言都是语言谱系分类法的单位,它们之间的关系上文已经介绍过了。世界语言有7000多种,如果我们从语族开始往下介绍,那是一个很大的体系网络。本文的主题是对语言的分类进行一个简述。为了便于说明和使读者易于理解,笔者将汉藏语系语族、语支、语言及方言大致情况用表格说明:
这里要说明的是:
第一、语言的谱系分类是以语言的亲属关系为依据的,然而这种亲属关系主要依靠研究者的分析推论得来,并无一个硬性的标准,不同学者间的差异是很大的。
第二、汉语自古以来是在一个相对比较孤立的环境下发展而来的,虽然与周边少数民族语言有过许多的交流和融合,多数情况是同化为一体,尤其汉语体系在统一文字的作用下,虽不同区域之间口语往往不能交流,但书面语是可以流畅沟通的。因此汉语在汉藏语系中分出汉语语族后,就没派生出不同的语支。汉语不同区域的变体,应该列为不同的语言还是方言,学者们有较大的分歧,但目前更多倾向于列为方言,即汉语从语族往后,没有不同的语支和语言,只有不同的方言。
类型分类法,又称结构分类法。
1772年,Diderot和d’Alembert在他们编纂的法国
《百科全书》中,在“语言”条下,作者根据语言的语法结构总特点,区分了两种基本的语言类型:类推型语言(langues analogues和换位型语言(langues transpositives)。然而这种二分法在某些方面含混不清,过于粗线条。十九世纪初期,A.W.von schlegle提出:“我们地球上不同民族以前和今天所说的语言,可以分为三类:没有任何语法结构的语言、使用词级的语言和具有屈折变化的语言。”即为大家现在所熟知的三重类型分类法,语言分成孤立型、粘着型和屈折型。这是一个非历史的分类系统。
现代语言学根据语言的共同形态结构对世界上的语言进行分类,即语言的形态分类(morphological typology),按照这种方法根据语言组合语素栬单词的方式,将语言分为“分析语”和“综合语”两类。
分析语和孤立语之间的概念有时并不很清晰,它们之间的关系常会出现两种情况,其一是将孤立语与分析语两者视为相同的概念;其二是将孤立语纳入分析语,将孤立语视为分析语最极端的表现。而综合语又细分为黏着语、屈折语和多式综合语三种。
下面笔者通过几个例子简略地介绍一下这几个概念:
1、孤立语,代表:汉语
孤立语的特点在于其一般不是通过词形变化来表达语法的作用,而是通过独立的虚词和固定的词序来表达语法意义。而且一般而言,孤立语缺乏数和格的变化。例如马字,一匹马是马、一群马也是马;而我字,做主语是我、做宾语是我、做定语还是我。
2、屈折语,代表:印欧语系诸语言
屈折语是以词形变化作为表示语法关系的主要手段的语言,特点是有丰富的词形变化来表示词与词之间的关系。这里的“屈折”是指词内部的语音形式的变化,也叫做内部曲折。
3、黏着语,代表:土耳其语、日语、维吾尔语
黏着语是一种语言的语法类型,通过在词根的前中后粘贴不同的词尾来实现语法功能。语法意义主要由加在词根的词缀来表示的,词缀分为前缀、中缀、后缀,常见的有前缀、后缀。
4、复综语(编插语、多式综合语),代表:美洲印第安语
复综语的特点是把主语、宾语和其它语法项结合到动词词干上,以构成一个单独的词,但表达一个句子的意思。其特征是:句子是基本的语言单位,没有独立存在的造句基本单位——词。词和句子合二为一,一个词的构成部分同时也是另一个词的组成部分,许多成分互相编插组合在一起连缀成句子。
语言学上这两种分类方法,是从不同的角度和特征对世界语言进行分类,各有特点,不能说孰优孰劣,都对语言的研究起着重要的作用。