数据挖掘技术在新生儿数据分析中的应用研究

来源 :东华大学 | 被引量 : 5次 | 上传用户:whitetooth
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
医院采集的原始数据逐年增多,大量的病人的基本信息和各种病例等原始数据都被存储了下来,这些激增的数据背后潜藏了大量有用的知识。如何抽取、挖掘出这些知识是当前的研究热点问题。数据挖掘作为一种有效的信息抽取方法和知识发现的手段,从医学数据库中提取有用信息,对这些数据的分析和评估,可以发现一些潜在隐藏的数据模式,并提供科学医疗判断和治疗,从而帮助人们提高对生育的认识,并增强对其现代生育的研究和管理。近几年来,上海市卫生局在全国率先建立了新生儿的出生状况数据库,对这些新生儿数据进行统计挖掘将对合理分配卫生设施和资源、预防新生儿疾病提供很大帮助。本课题以上海市新生儿数据为例,进行了数据挖掘技术在新生儿数据分析中的应用研究,通过对影响新生儿出生的各方面因素的分析,为优生优育提供了量化的依据,方便决策人员了解上海市各区县的新生儿出生状况,并做出正确决策,为专家进行诊断提供参考。首先,课题介绍了新生儿数据预处理的方法,通过数据清洗、数据转换、维数消减等数据预处理,对遗漏数据、噪声数据、不一致数据等进行了有效处理。数据预处理提高了数据的质量,提高了数据挖掘所获知识的质量。然后,介绍了关联规则的挖掘算法,重点研究了经典的关联规则挖掘算法Aprior算法,提出了Aprior算法的优缺点,针对Aprior算法需要多次扫描数据库和产生大量频繁项集的缺点。提出了基于划分的Aprior改进算法,并对新生儿数据进行了关联规则分析。最后,设计了基于Web的新生儿可视化数据挖掘分析系统,该系统较多的考虑了用户与系统中的交互性,运用了Flex技术提供的丰富的互动式图表,非常直观有效的展示了数据分析结果,并对系统涉及到的每一个步骤进行描述与实现。对上海市各医院存储的大量新生儿原始数据进行了分析,得到了上海市新生儿出生状况的一些潜在规律,方便了决策人员实时监测上海市各区县的新生儿出生状况及趋势,具有一定的现实意义。
其他文献
随着互联网技术的发展和移动通讯工具的普及以及微信、微博等社交平台的广泛应用,以提高交流效率或者表达某种情感为目的的、采用包含有自创、缩略词语、特定符号及其独立或者
学位
集群行为是对现实生活中的生物群体和人工群体的一种高度抽象。单一智能个体只能完成比较简单的任务,但是由很多智能个体组成的多智能体系统能够通过个体间的相互作用涌现出集体智能,完成比较复杂的任务,解决现实生活中很多难以解决的问题。在当前社会中,多智能体系统已经广泛的应用到人们生活的方方面面,包括环境监测、灾难搜救、军事行动和工业操作等等诸多领域,对多智能体系统的研究具有重要的理论和现实意义。为了更好的分
随着工作流技术的日趋成熟,越来越多的企业开始采用它作为提高企业效率的手段。工作流管理系统主要用于协调商业过程的执行,这些过程往往涉及到分布的资源。随着企业组织越来
细分曲面既具有多边形网格的拓扑任意性,又具有参数曲面的连续性、一致性和仿射不变性等优点,因而在曲面造型中得到了非常广泛的研究与应用。自适应细分技术解决了均匀细分产
人工神经网络(Artificial Neural Network)是一种旨在模仿人脑结构及其功能的信息处理系统,它是对人脑神经网络的简化、抽象与模拟。目前已有上百种的人工神经网络模型,这些
不同种类的纤维纺织品,其强度、截面粗细、纵向长度、卷曲度等特征信息均不相同。同一种类的纤维纺织品也会存在个体差异。这些特征信息是判断纤维对象成熟度的重要标准,是纤
无人飞行器航迹规划就是在特定约束条件下,寻找满足无人飞行器机动性能及战场环境限制的,从出发点到目标点的最优飞行轨迹,是无人飞行器进行自主飞行的关键技术。本论文针对
随着无线网络技术的广泛应用,无线局域网(WLAN)的相关技术也越来越成熟,WLAN以其灵活性和移动性等优势成为网络技术领域的热点话题,同时WLAN也因其自身固有的特点,如传输介质的开放
传统的机器学习和数据挖掘算法大多基于这一假设:训练数据集和测试数据集具有相同的特征空间和数据分布,因而更侧重于与其他任务或者先前学习到的知识相互独立的单任务学习。