论文部分内容阅读
本文主要研究网络文本中的释义模式,以“百度知道”上的释义文本为研究对象,尝试分析释义文本的模式、描述释义文本的面貌。并期望此项研究能应用到工程实践中。本研究基于“百度知道”上的问答数据,在采集的100,000个问答网页基础上,进行了人工筛选、标注、分析、抽象等操作,得出了释义的成分、释义的元语言(特征词)、释义框架结构组成的模式。从而描述清楚一种具体的网络文本类型——释义文本——的面貌。本文共分为五部分。第1章绪论,主要介绍选题的来源及起因,研究目的、价值意义和研究综述。第2章主要对研究对象进行了界定、研究内容、研究方法和步骤进行了论述。第3章详细论述了从语料的选取、预处理到语言模式分析和分析结果说明整个模式研究过程。第一步,采集的语料并按照要求进行预处理,第二步,用一套形式符号体系对这些语料进行标注,第三步,以释义项为中心的思想进行抽象,得出了包含释义成分、释义元语言(特征词)、释义框架及各个成分间关系的模式。第3章还将本次得出的模式与规范定义模式的研究成果进行对比和分析。第4章是实验测试,对所抽象出的模式进行测试并对得出的结果进行分析。第5章总结了本研究的不足之处,并思考了以后工作的方向。本文通过以释义项为核心的思路,对采样的释义语料的解构、分析和抽象,总结出了包含被释义项在内的31个释义成分、341个释义特征项;与规范的定义模式相比,本文其实更注重更多类型的释义成分以及释义结构,在特征词上本研究得出的数量远超过定义模式中涉及的,只是在本文缺少一些只在书面表达中出现的特征词;最后,我们还通过实验测试了我们得出的释义特征词和结构,证明这些模式是有效的,但准确率有待提高。