论文部分内容阅读
目的
运用数据挖掘方法Relief F算法,在脑卒中注册数据库的基础上评估与徐州地区脑卒中发生相关的因素。
方法回顾性分析徐州医学院第二附属医院神经内科脑卒中注册数据库中自2013年6月至2014年6月收录的546例急性脑梗死患者(脑卒中组)的临床资料,同时对本地区同期体检的546例健康体检人群(健康对照组)进行相关资料的收集及整理,并录入epidata数据库。首先进行数据的归一化,将其转化为1~10之间的数。应用Relief F算法进行数据分析,采用Matlab软件进行编程计算,将主程序运行20次,然后将结果汇总求出每种权重的平均值,得到既往病史及血液学指标在健康对照组与脑卒中组中的权重值。
结果Relief F算法数据分析结果显示,在危险因素方面,相对于健康人群,脑梗死病史在脑卒中发生中占的权重值最大(0.0353125),其次为饮酒(0.01175),而高血压、糖尿病、吸烟、短暂性脑缺血发作史在区分健康人群与脑卒中人群所占的权重值并不大;在实验室检查方面,血尿素氮水平(权重值0.0072)、血尿酸水平(权重值0.0071)、胆固醇水平(权重值0.0067)及血同型半胱氨酸水平(权重值0.0064)在区分脑卒中人群与健康人群所占的权重值较大,其次是高密度脂蛋白(权重值0.0062)、低密度脂蛋白(权重值0.0041)及甘油三酯(权重值0.0039)。
结论应用Relief F算法可以挖掘脑卒中注册数据库中与脑卒中发生密切相关的潜在危险因素。