面向血糖预测的机器学习技术研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:happyboylss
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在今天这个时代,越来越多的人患了糖尿病,但其中很多人并不知晓或者确切他们是否患病。糖尿病是一类非常可怕的慢性病,被彻底治愈的可能性非常低。因此,在前期如果能尽早识别高风险患者,及时地介入患者的护理过程,养成健康生活方式甚至于提前药物治疗,能够减少患病风险。依据目前在该方面的研究,积极地前期预警治疗至少会降低30%到60%的得病风险。所以,提前确定有大概率患病的患者,不仅可以改善病情,还可以加强公众的临床管理,是非常有意义的。为了提高糖尿病患者的知晓率,从而及时地对病情进行管理,本文从患者的代谢数据出发,深入分析不同检查项目对血糖水平的影响,并充分利用检查科目和项目之间的包含关系,优选特征。同时,本文转换了预测思路,将数值预测转换成二分类问题,此时遇到的主要问题是数据集的类别不平衡问题。为此,本文基于SMOTE设计了一种新的过采样方法,来提高分类效果。本文的研究工作,包括以下内容:(1)针对患者检查项目多、特征复杂的的情况,本文提出了一种基于序列后向选择的层次化特征选择方法。首先,由于SBS算法巨大的计算开销和方法的灵活性,本文在该方法思想的基础上,通过为所有特征进行重要性排序,根据排序结果,有针对性地测试剩余子集的模型效果,直到发现当前状态下的最优子集。还应注意到,在医疗范畴内所收集到的数据,领域性和专业性很强。在特征选择过程中,一般只考虑患者的检查项目,而忽略了患者的检查科目和检查项目之间的对应关系,本文基于检查科目与项目之间的层次关系,提出了层次化的特征选择方法。(2)针对非平衡数据集中少数类样本分布的特点,设计了一种基于RegionSMOTE的非平衡数据处理方法。为了结合边界分布信息,本文制定了vote规则,将少数类样本分为安全样本、中间样本和危险样本,对不同的样本采取不同的处理策略。通过将患者的血糖值进行标签转化,将数值预测问题转化为二分类问题,对少数类样本进行过采样,提高整体分类性能。另外,本文还从UCI中提取了三个不平衡数据集对Region-SMOTE方法进行了验证。本文从现实实用的角度出发,研究工作从原始医疗数据的分析和处理、基于SBS的层次化特征选择方法和组合模型预测方法等几方面开展工作,良好的实验结果证明了所提出的方法的有效性。本文工作对于充分利用医疗数据,搭建规范化的血糖预测系统具有指导意义和实用价值。
其他文献
支持向量机是近三十年刚刚崛起并被广泛应用的学习算法,以处理小样本数据与解决非线性不可分问题而被广泛应用于各个领域,是一基于相似关系准则的核学习算法。同时支持向量机
切换系统是一类混杂系统,“混杂”指的是动态连续与动态离散的组合。由于控制领域的快速发展,对切换系统的研究也越来越丰富。近年来,线性切换系统的控制技术已得到广泛应用,
日俄战争结束到“九一八”事变前,日本在中国东北地区建立起侵略机构,分别利用在南满地区的“四头政治”和东满地区的“间岛总领事馆”对东北地区进行侵略扩张。日本在日俄战争结束后接管俄国的旅大等地特权,在南满地区开始殖民统治,但南满地区无法满足日本的野心,在日本认识到东满地区的军事战略地位重要性后,将南满地区作为侵略东北的正门,将东满地区作为后门,开始有计划有步骤的实施侵略政策。日本侵略南满和东满的政策背
移动机器人,是机器人的一个重要子类,在军事、工业、服务业等各个领域都有着重要的应用。由于其执行大部分任务都需要在未知、动态、非结构化的环境中移动,因此其自主导航能
近年来,我国大气污染问题突出,对人们的生产、生活构成了严重威胁。随着人们对灰霾问题的关注及城市空气质量的预测需求,针对区域空气质量预报的研究也愈发迫切。本文在总结分析国内外空气质量预报研究动态和技术难点的基础上,以秦皇岛市为研究区域,分别开展了基于数值模式、神经网络方法的空气质量预报研究,并对比分析了不同数值模式和神经网络方法的预报性能。在此基础上,利用机器学习集成方法,以PM2.5浓度预报为研究
目的(1)了解高影响因子泌尿外科学杂志发表的观察性研究文献的报告质量,探索存在的报告缺陷及其影响报告质量的因素;(2)了解高影响因子泌尿外科学杂志发表的观察性研究文献统
近年来,机械臂越来越多地被应用到日常生活和工业生产中,关于机械臂的设计研究越来越多。但是机械臂在进行大尺度目标的抓取任务时,有着比较大的局限性,比如机械臂尺度和质量
贫困是制约中国全面建成小康社会的“绊脚石”,中国共产党高度重视解决贫困问题,投入大量人力物力、制定针对性极强的政策推进精准扶贫,随着脱贫攻坚的深入,中国的绝对贫困得到了有效遏制,但是在消除绝对贫困以后,中国的贫困问题将会以相对贫困的形式存在。部分脱贫群众再次返贫,如何彻底解决相对贫困都将会严重影响中国全面建成小康社会战略的推进。并且十九届四中全会明确提出了“坚决打赢脱贫攻坚战,建立解决相对贫困的长
随着机器人技术的快速发展,自动化技术也越来越多地应用于食品加工领域。但是,对于食品行业操作对象柔、脆、易损,形状、尺寸及质量差异较大等问题,目前现有的机器人末端执行
电力计量装置作为连接用户与电力计量单位的重要桥梁,它的准确性直接影响到贸易结算的准确和公正,涉及到广大用电用户以及供电单位的利益。随着用电信息采集系统的建立,电力