论文部分内容阅读
目的突发监测是根据词频变化统计出低频却具有情报意义的突发词,探测新兴研究热点的方法。本研究以全身炎症反应综合征治疗药物为例,利用词频突发监测方法,将突发词分析与高频词分析相结合,探讨全身炎症反应综合征治疗药物现状及发展趋势,为开发全身炎症反应综合征治疗新药提供决策服务,并为如何利用突发监测的方法进行信息研究提供可靠依据。数据来源与分析方法本文以PubMed数据库中近10年全身炎症反应综合征药物治疗方面的文献为研究样本。SemRep是美国国立医学图书馆开发的一种基于一体化医学语言系统,通过提取自然语言语义关系的方式进行数据挖掘的软件,利用SemRep提取相关文献的题目和摘要中的语义关系和热点概念。SemRep语义结果处理系统是基于Visual Basic编程语言开发的处理SemRep语义结果的软件,利用SemRep语义结果处理系统筛选全身炎症反应综合征治疗方面的概念。对写法不同意义相同的概念进行合并,统计每个概念每年出现的频次和10年的累积频次,将概念频次和文献量导入Access数据库。在某个领域的文献集合中,含有突发词的文献占该领域的文献比例显著增加时,则这些突发词越来越成为该领域的研究焦点,而突发权重指数就是为了对突发词的突发程度进行排序。用Java语言编写程序访问Access数据库计算这些相关概念的突发权重指数,将这些概念按突发权重指数高低和频次高低进行排序,对排序结果进行分析和对比,探测全身炎症反应综合征药物治疗领域的研究热点和重点。结果从PubMed数据库中共检索到相关文献4623篇,用SemRep和SemRep语义结果处理系统对这些文献进行处理,SemRep从文献的题目和摘要中共提取出882个热点概念,将写法不同意义相同的概念进行合并共得到有效概念776个,统计这些有效概念每年出现的频次和10年的累积频次,并计算其突发权重指数,分别按突发权重指数高低和频次高低进行排序,对排序结果进行分析和对比。突发权重指数越大,表示该种药物是全身炎症反应综合征药物治疗领域研究热点的可能性越大;频次越高,表示该种药物是全身炎症反应综合征药物治疗领域研究重点的可能性越大。结论突发监测的方法适用于某研究领域前沿趋势的探测,它是根据词在时间顺序上的变化来反应研究热点,高频词分析是用词的频次来显示研究重点,这两种方法在一定程度上起到互相补充的作用,在新兴研究热点的发现上突发监测优于传统的高频词分析方法。利用突发监测的方法探测全身炎症反应综合征治疗药物的研究趋势,为文本知识发现提供了一种新的尝试。