论文部分内容阅读
随着计算机与网络的普及、人工智能等科学技术的发展,知识呈现出爆炸性裂变性的增长态势。人们获取的信息量由匮乏转变为过载,对信息阅读形式也由全文式转变为碎片式。人们无法快速准确找到自己所需要的信息,面临着“信息丰富、知识贫乏”的尴尬状况。这就驱使着人们重新审视当前信息资源的描述与组织方式,一方面要认识并重视用户需求转变的现实状况,另一方面需要认识到引起用户需求转变的信息资源数量庞大、动态、频繁更新、种类繁多、异构、无结构化、缺乏语义等问题。提供有效的资源描述与组织方法,基于语义层面的描述与组织信息资源,以细粒度化的方式建立描述框架并对知识进行组织,有助于缓解用户遇到的上述问题。为此,本文在回顾科技文本内容描述与组织研究现状的基础上,基于知识元理论和语义学理论,提出了一种基于知识元的科技文本内容描述框架及组织方法,以期为知识描述与组织提供一种思路。首先,以知识元理论、语义学理论为支撑,提出了针对细粒度知识描述的基于知识元的科技文本内容描述框架。该框架通过深入地、细致地、多角度地对科技文本的内部特征及语义关系进行细粒度地描述与揭示,详尽地抽取出科技文本中具有代表性的若干知识元,这些知识元之间存在着不同的语义关系,在实现知识细粒度化描述的基础上,方便了后续科技文本的内容组织。其次,在科技文本内容描述框架的基础上,提出了一种基于知识元的科技文本资源内容组织方法,即通过语义分析,建立知识元之间的映射关系,进而从知识元的角度对科技文本的内容进行知识组织。最后,利用python爬虫程序爬取知网上以“知识元”为主题的科技文献作为数据集,并采用Gephi软件可视化地展示出科技文本内容之间的语义关系网络,形象化地呈现了本文预期实现的知识组织效果。本文给出的基于知识元的科技文本内容描述框架与组织方法,能够深入分析科技文本的内部内容特征,实现科技文本的细粒度化地描述与组织,丰富的语义关系能为提高用户学习效率及学习深度提供支持。