面向传染病主动监控的异构数据挖掘方法研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:RaymanL
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
主动监控是最有效的传染病预防和控制方法。通过派遣医护人员对监控区域内的个体进行全面排查可从根本上抑制疾病传播。为了最大化有限医疗资源的利用率,主动监控策略通常只在部分高风险区域执行。因此,如何准确的评估待监控区域的传播风险,为有限资源的合理分配提供可靠依据,是提高主动监控策略有效性的关键。疾病传播的主要驱动力是人类的迁移行为,其主要动机和决策过程受多重因素影响,如:经济、环境、天气、交通等。找到各类因素与迁移行为之间的内在联系,则可以建模传染病的传播过程,从而预测潜在的传播风险。在大数据时代,异构数据挖掘理论和技术日趋成熟,为传播风险的预测提供了新的机遇,同时也面临如下挑战:(1)如何发现并建模主导传播趋势的迁移模式,并找到隐含在这种迁移模式背后的驱动因素,以解释感染病例存在的本质原因和生成机制。(2)如何制定全局最优的物资分配策略,在最大化有限资源利用率的同时兼顾模型在未来监控过程中的预测能力,即:模型可持续性。(3)如何反映动态的迁移行为对传播趋势的实时影响,并解决驱动因素在时间和空间两个维度的影响力差异性(即:时空异质性)问题。基于以上问题,本文主张通过异构数据挖掘方法实现准确、可持续、实时的传播风险预测,主要工作介绍如下:(1)提出了一种基于时空传播网络的主动监控方法。该方法主张融合异构数据建模人类的迁移过程从而预测传播风险,在实际应用中为制定合理的主动监控策略提供准确的参考信息。具体而言,通过分析人类的迁移行为,将传染病的输入和传播过程划分为四个阶段:是否外出,去往何处,是否感染,何时返回,并将该过程建模为一个时空传播网络(Spatiotemporal Diffusion Network)。在此基上,提出了一个新型的传染病主动监控框架(ASPII),该框架集成了机器学习模型、人口辐射模型、疟疾传播模型,融合了气象、环境、生理、人口、地理、社会经济、监控记录等数据。此外,考虑到影响人类迁移行为的因素有多种,这些因素对不同监控区域内迁移行为的驱动力不同,即:空间异质性。本文提出了一种混合优化算法,该算法可在优化各因素权重系数的同时自动的对监控区域进行分类,很好的解决了空间异质性问题。(2)提出了一种基于强化学习的可持续主动监控方法。主动监控的实施通常仅限于部分高风险区域,过程中反馈给预测模型的病例数据是不完整的,易导致模型在后续风险预测中出现较大偏差,甚至失去可持续预测能力。针对该问题,本文采用强化学习算法对监控物资进行动态分配,从而提出了可持续主动监控(Sustainable Active Surveillance,SAS)框架。该框架由预测器(Predictor)、分类器(Classifier)、规划器(Planner)三部分组成,它们之间通过相互合作共同完成主动监控任务。其中,预测器可从正、反两个角度对待监控区域的风险进行评估,以保证预测器的稳定性。通过分类器可将属性相似的待监控区域划分到同一类中,以实现未监控区域和已监控区域间的数据共享。通过规划器可给出物资分配的全局最优化策略,该策略不仅考虑了有限物资的利用率,还考虑了模型在后续风险预测过程中的可持续性。(3)提出了一种基于在线学习的实时主动监控方法。各类驱动因素对迁移行为的影响是具有时序性和实时性的,如四季更替和天气突变等。因此,传染病的传播趋势也同样是具有时序性和实时性的,如疟疾病在夏季和晴天传播更快。此外,驱动因素对各监控区域感染风险的影响,不仅在空间范围内存在差异,在时间尺度上也存在差异,即:时空异质性。针对以上问题,本文提出了一种基于在线学习的实时主动监控方法(Real-time Active Surveillance,RAS)。该方法采用FTRL-Proximal算法对模型参数进行更新,不仅可以反映各类驱动因素对传播风险的实时影响,还可保证各驱动因素权重系数的稀疏性,有利于发现隐含的主导因素。此外,本文还提出了一种动态的监控区域分类方法,该方法可以自动优化类别个数及各类中待监控区域数,很好的解决了时空异质性问题。
其他文献
"卓越课堂文化"建设是深圳南山区基础教育综合改革的重要目标和内容,即构建具有南山特色、以现代教育技术为手段、以学为本、和谐互动、网络支持、资源丰富、轻负高质的课堂
探讨在网形设计、同步观测区的划分、同步观测区观测顺序的选择、指挥调度的工作模式等方面,对大规模高精度GPS网实施方案进行优化设计的方法。
当药为河北、内蒙古一带的民间草原,来源于獐牙菜属植物,主要的有效成分为獐牙菜苦苷,具有清肝利胆、清热除湿功能,并且抗炎作用强,该属植物中的多个品种都被临床广泛用于治疗急慢
目的观察舒肝解郁胶囊联合氟西汀治疗抑郁症的临床疗效和安全性。方法将68例抑郁症患者随机分为2组。治疗组34例予舒肝解郁胶囊联合氟西汀治疗,对照组34例予氟西汀治疗。分别
目的:随着我国人口的急剧膨胀,老年忠者比例也在连年上升。急慢性肾功能衰竭,肾小管萎缩,肾病综合症等疾病在人群特别是老年人群中屡见不鲜。老年肾内科患者其病情发展极为迅速,并
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
研究了不同添加量的麦麸膳食纤维对面团流变学性质及面包焙烤品质的影响,结果表明:麦麸膳食纤维对面团流变学性质存在正反两方面的作用,超过30g/kg的添加量使面包品质变差,但可通过添加