论文部分内容阅读
随着现代科学技术的迅速发展,文献资源的数量也急剧增加,如何在海量的信息中找出自己感兴趣的最新的、最全面的信息己成为一个亟待解决的问题。专利可以反映最新科研动态,研究课题开发现状、技术水平和法律状态等信息,具有巨大的科研价值和商业价值。然而,相比其他的文献资源,专利信息的利用率却是比较低的。在专利信息越来越受关注的今天,实现专利与期刊文献的互操作具有重要的意义。国际专利分类法(International Patent Classification, IPC)是目前国际上最通用的组织和管理专利文献的工具。中国图书馆分类法(Chinese Library Classification,CLC)是我国使用最广泛的综合分类法,多数文献都以此进行管理和使用。完成IPC与CLC之间的映射是实现专利信息与其他文献相互关联及不同组织体系间交叉浏览和检索的重要途径。本文在调研现有互操作项目和分类法类目映射方法的基础上,提出了基于机器学习中分类算法实现IPC和CLC之间类目映射的方法,通过对某类目标识的语料信息进行训练得到这个类目的分类器,然后用该分类器对另外一个分类法类目标识的语料进行分类,分析分类结果判断出与哪个或哪些类目具有对应关系。最后通过实验验证了该方法可以完成不同类目间的映射。