论文部分内容阅读
药品不良反应(Adverse Drug Reaction,ADR)是一种有害的和非预期的反应,它不同程度地损害着人体健康,甚至危及生命。因此,对于上市后药品的ADR监测越来越受到世界各国的高度重视,成为药物警戒工作的重中之重。现有的研究主要基于药品不良反应监测数据,利用各种信号检测方法来挖掘药品和不良反应之间的关联关系并及时进行风险预警,针对单个的药品和单个的不良反应,对药品类的信号挖掘研究缺乏,而从ADR视角挖掘药品风险分类和分级的研究更是不足。为此,本文提出了一种基于聚类分析的药品风险评估方法来挖掘药品风险等级分类及药品类的关键特征,以期为我国的药物警戒工作提供决策参考。本文选取国家食品药品监督管理局(China Food and Drug Administration,CFDA)2010年到2011年的ADR监测数据中的76种抗生素所引起的共400种的不良反应为研究数据,结合WHO-ART不良反应术语集和药品说明书对原始数据进行规范化处理,提取报告类型(一般、严重)、药品类别、药品名称、不良反应名称等记录属性值作为实验数据集。(1)信号检测方法研究:研究主流的信号检测方法并应用于我国ADR监测数据,经过比较分析,选择PRR、IC、二元值方法作为本研究的信号检测方法,并将预处理所得数据集分别以三种方法建立向量空间模型(Vector Space Model,VSM),然后使用肘部法则确定各种信号检测方法的最佳聚类数。(2)聚类算法应用研究:根据选取的ADR监测数据的特点,以药品名称为对象,以药品不良反应为特征,使用模糊C均值(Fuzzy C-Means,FCM)聚类算法分别基于三种信号检测方法对抗生素药品进行实验仿真,并将药品划分为三类。然后设计并使用分类正确率评价函数确定PRR方法为最佳信号检测方法。(3)风险分级评价研究:提出了一种以不良反应严重程度计分的损伤指数,基于计算三类抗生素药品的损伤指数值得出了相应的风险等级,并通过各风险等级药品中处方药与非处方药的数量,以及严重不良反应的比例等信息验证了结果的可信性。(4)风险特征提取研究:以TF-IDF(Term Frequency–Inverse Document Frequency)算法提取各类别的排名前10的关键不良反应特征并基于WHO-ART关联累及系统-器官进行各类别的风险评估,进一步验证了风险特征与风险等级的对应正确。本文以我国ADR监测数据中的抗生素药品为研究对象,利用聚类分析和特征提取技术实现了基于ADR的药品风险分级和风险特征识别,为建立药品风险分级机制提供了可借鉴的方法,也为我国ADR监测报告数据资源的再利用提供了一种新的思路。