论文部分内容阅读
对称性是一种普遍的自然现象,广泛存在于人类社会生活中。对称性思想是人类熟知和常用的认知方法,深深影响着人类生活的方方面面,在众多的学科领域有着极高的地位。语言作为思维的载体,人类交流的工具,也受到对称性的影响。由于古人利用矛盾对立的哲学思想认识世界,非常崇尚具有对称性的事物,并将对称性思想应用在诸多领域,汉语也深受其影响,在多个语言层面上表现出对称特征。同时,由于汉语的单音节语素灵活自由,容易组合成对的特征更是使汉语的这种对称特征得到广泛的传播。我们实验室重点探索的是由陈寅恪先生的《与刘叔雅论国文试题书》中关于中文文法的问题,指出了汉语中的对称特征,并进行深入的研究,结合自然语言处理技术,试图为中文文法的确立提供帮助,为汉语的自然语言处理提供理论支持。本文较为详细地描述了汉语中存在的对称性现象,并对字、词语和语句三个不同语言结构单位中的对称性现象进行分析,指出它们各自的表现形式、特点以及形成原因。并描述了汉语中极具对称性特征的对联,指出了对联的上下联之间字数相等,对应的语言单位词性和类别都应相同,注重用字的平仄,音韵相对,声调和谐。依据写作方法的不同将对联进行分类,指出各类别的特点。使用认知语言学的理论,分析对联的认知过程和认知特点。依据概念合成理论原理,将对联的上下两联作为两个输入空间,在空间内部和空间之间形成复杂的映射网络,并利用类属空间的特性在两空间合成时进行检验,完成对联的认识过程。此外,分析了对联在认知过程中所表现出的特点,表现对象在形式和意义上的双重突显,分析对联时需要与语境建立最大关联,在不同的认知阶段表现出的不同的美学效应,实现对联更全面深入的研究。通过完成对联的认知过程的分析,并结合对联的对称性特点,本文采用格律严谨的《笠翁对韵》作为建立语料库的语料,并在此基础上进行相关程序实现。由于中文的独有特点,只存在字的界线而没有词的界线,分词就成为中文自然语言处理的一个难点。本文对现在使用较为广泛且成熟的三种分词方法进行了介绍和比较,并结合对联与《笠翁对韵》中存在相当多的对称词的特征,选择了正向最大匹配分词方法来实现对联的分词。语料库为分词结果中的词语提供多种对称词以供选择,结合上联语义及语境,可以选择最佳的对称词组合,来实现自然语言理解和生成。这是研究汉语中的对称性特征,并利用对称性的原理来进行程序实现的一次探索,还存在着巨大的理论和技术空间需要进一步展开。