论文部分内容阅读
世界范围内的自然语言处理,经过字处理、词处理阶段之后先后进入句处理阶段。以往句处理研究的重点通常是句法结构或语义结构的自动分析和标注。实际上,句处理的核心问题是让计算机理解并生成自然语言的句子。无论是基于规则还是基于统计的处理策略,在结构主义背景下都面临“句法—语义接口”问题,而这一问题至今尚未解决。“句法—语义”接口,不仅是句法语义学的重要内容,也是语言信息处理领域的难题。(孙道功2011)本文基于“句法—语义”接口的相关研究成果,以名核结构为研究对象,主要从“词汇单位—角色实现—角色排序—句法映射—语义变化”的角度,揭示“句法—语义”接口的机制,深化句法语义学理论。首先,以《现代汉语受限词表》为基础,选取现代汉语中的典型名词作为研究对象。基于本文确定筛选原则,最终确定70个典型名词作为研究对象,然后参考《现代汉语词典》和《现代汉语规范词典》的释义,对70个名核结构中心语进行语义归类,并进行词汇义征分析,归纳出172个词汇义征。基于名词的词汇语义特点,并借鉴已有的句法范畴义征标记集,分析名核结构所关涉的语义角色的范畴义征,最终从中归纳出26个句法范畴义征。其次,考察了名核结构中词汇单位到语义角色的衔接问题。具体言之,在人物类子场、事物类子场、事件类子场、时间类义场、方位类义场、处所类义场六个典型义场中进行名核结构的衔接研究。首先基于名核结构中心语语义子场的词元义征表达式,考察各个词元组合结构层面可能涉及的修饰成分和中心成分范畴;然后对词语在组合层面所涉及的语义角色范畴进行范畴义征分析,考察能够进入两个范畴的词语限制条件和进入该范畴的相关词元,在此基础上考察名核结构词汇单位与语义角色范畴衔接的机制和特点。结论认为不同类型的名核结构中心语,其接口的表现有所差异。人物类子场中心语与事物类子场中心语所构建的名核结构,句法语义模式排列较为整齐,前者子场内一个典型名词就可以基本上总结概括出所有句法语义模式,而其他的人物类典型名词也都可以套入这些句法语义模式之内,构成衔接机制的融合性范畴义征主要体现在[+有生性][+施动性][+指称性][+客体性][+被描写性][+被支配性][+被领属性];后者主要分为两大类型,实体事物名词与抽象事物名词,由这两类各自的典型名词所构建的句法语义模式也较为整齐,构成衔接机制的融合性范畴义征主要体现在[+客体性][+功能性][+区别性][+成果性][+被描写性][+受动性][+被领属性][+关涉性][+被支配性]。人类与事物义场的词元在名核结构建构的句法语义模式中占据了很大比例,同时这两个义场所构建的句法语义模式中的融合性性范畴义征一致性也较高,体现在同时具有[+指称性][+客体性][+被描写性][+被支配性][+被领属性]等范畴义征。事件类子场中心词对应的句法语义模式相对前两类数量较少,排序也并不整齐,构成其衔接机制的融合性范畴义征主要体现在[+时间性][+方位性][+处所性][+类别性][+目的性]上;时间类子场、方位类子场及处所类子场的中心词元的衔接机制具有相同的规律,即:句法语义模式数量少,排序不规律,构成其衔接机制的融合性范畴义征分别体现在:[+时间性]、[+方位性]、[+处所性]。尽管名核结构中词元义征的范畴义征之间的相容性为词元组合提供了可能性,但词汇语义对词汇到语义角色的投射仍起重要决定作用。最后,基于名核结构标注语料库,探讨了名核结构的词汇语义对句法结构的制约,以及句法结构对词汇语义的反制约,总结词汇语义与句法结构的互动制约关系。结论认为名核结构中相同的中心词元,在与具有不同词汇义征的词元组合时,词汇义征的不同决定了该中心词元在结构中担任不同的语义角色,而这种差异性体现出词汇语义对组合对象角色选择的制约。其次,名核结构词语的词汇义征对名核组合框架产生影响,同一义场的词元,具有相同的词汇义征,决定了它们能够进入相同的组合框架中,但不同的词汇义征决定了出现在不同组合框架的频率有所差异。最后,句法结构能够对词汇语义产生反制约的作用,只是这种反制约作用相对于词汇语义对句法结构的制约来说,力度较弱。这种反制约能力主要体现在引发词汇语义变化,这些变化表现在词汇语义在组合结构中会出现义征增加、义征凸显、以及义征转化的现象。本文以名核结构作为研究对象,基于真实语料,坚持定量研究与定性研究相结合的方法,但很多方面的研究比较薄弱或者尚未涉足,比如在研究方法和思路上,借鉴了大量动核结构的研究,并未形成名核结构独立的研究体系,也并没有考虑到实际语境中的语用因素的影响,这些内容是名核结构下一步研究中亟待解决的问题。