基于机器学习的IPC与CLC类目映射方法

来源 :北京林业大学 | 被引量 : 0次 | 上传用户:MaoZeDongDaShaBi2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代科学技术的迅速发展,文献资源的数量也急剧增加,如何在海量的信息中找出自己感兴趣的最新的、最全面的信息己成为一个亟待解决的问题。专利可以反映最新科研动态,研究课题开发现状、技术水平和法律状态等信息,具有巨大的科研价值和商业价值。然而,相比其他的文献资源,专利信息的利用率却是比较低的。在专利信息越来越受关注的今天,实现专利与期刊文献的互操作具有重要的意义。国际专利分类法(International Patent Classification, IPC)是目前国际上最通用的组织和管理专利文献的工具。中国图书馆分类法(Chinese Library Classification,CLC)是我国使用最广泛的综合分类法,多数文献都以此进行管理和使用。完成IPC与CLC之间的映射是实现专利信息与其他文献相互关联及不同组织体系间交叉浏览和检索的重要途径。本文在调研现有互操作项目和分类法类目映射方法的基础上,提出了基于机器学习中分类算法实现IPC和CLC之间类目映射的方法,通过对某类目标识的语料信息进行训练得到这个类目的分类器,然后用该分类器对另外一个分类法类目标识的语料进行分类,分析分类结果判断出与哪个或哪些类目具有对应关系。最后通过实验验证了该方法可以完成不同类目间的映射。
其他文献
伴随着信息技术的飞速发展,计算机网络的应用已经深入到各个领域,并发挥着积极的作用。作为网络数据的重要形式,数据流的应用价值日益凸显,在网络管理、工业控制、市场分析等
科学计算可视化是运用计算机图形的原理和方法,将科学和工程计算等产生的数据转换为图形和图像,以直观的形式在计算机屏幕上显示出来。地震勘探是油气勘探的主要手段,将可视