数据质量的统计诊断实证研究

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:zldzhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
社会经济发展需要真实、准确、全面的统计数据,数据的质量是各行业发展的一面镜子,质量的高低决定了镜子的清晰程度。统计数据的质量是数据质量的核心部分,尤其是医疗行业中的统计数据关系到患者的切身利益,其质量更要得到重视。为了了解复杂的医疗费用数据的构成情况,以及寻找影响其统计数据质量的原因所在,本研究特选取具有高昂医疗费用的慢性肾病作为研究对象,通过诊断其数据成分,从而判断出影响其数据质量的问题,以达到有效诊断数据,优化数据处理,科学管理医疗数据的目的。针对实际数据没有满足既定假设,使得分析结果不可靠等问题,越来越多的统计学者通过数学模型和方法对我国的统计数据进行诊断。在此背景下,本文借助慢性肾病住院费用的数据进行合理的统计诊断。研究从疾病患者的原始数据及实际现状出发,着眼于数据质量管理控制的理论基础,对影响慢性肾病住院费用影响因素进行分析,使用自变量选择的方法对影响因素进行初步筛选,通过SAS运行得出最优子集并建立回归模型;然后,基于数据删除模型和局部影响分析的理论基础,运用SPSS判断异常点,用R软件进行数据参数估计、统计推断等环节的多维度分析;最后,以实例认证进行模型拟合优度的数据对比,并进行数据变换处理,得出提高数据质量的结论。文章的研究目的是希望通过诊断数据点对回归模型的影响,寻找提高模型优化的切入点,以透过实际数据反映的问题来探索提升数据质量的本质,为现实中高昂的慢性肾病治疗费用的统计数据管理提供政策建议。
其他文献
二维材料与三维材料相比,具有更高的比表面积,金属原子在其上能够较为均匀的分散,不仅提升了金属原子的利用效率,而且可以形成形态各异的活性位点。因此,以三维材料为负载的过渡金属粒子通常具有良好的催化活性。当减小过渡金属粒子的尺寸至单个原子时,由于独特的电子结构和单原子活性中心的不饱和配位环境,催化剂的性能可由此得到大幅度的提升[1-3]。然而,目前我们在设计和制备具有较高稳定性的单原子催化剂方面仍然面
论文在前人研究资料的基础上,对研究区的核心地质问题进行重点分析,对其构造演化特征、泥页岩平面展布特性、有机地化特征、矿物特征等内容进行归纳总结概括,分析页岩气富集地质特征;获取关键评价参数,得到有效含气泥页岩层系的烃源岩面积、厚度及含气性,并在此基础上计算资源量并预测有利勘探区块。前人研究表明,沁水盆地构造相对稳定,盆地总体是一大型复式向斜构造,太原组时期海侵方向发生改变,由西北方向变为东南方向,
乳酸菌胞外多糖(exopolysaccharide,EPS)是乳酸菌在生长代谢过程中产生的一种高分子聚合物,由于菌株基因多样性以及EPS结构的多样性使得EPS生理活性也具有多样性,在各个领域都具有很大的潜在利用价值。本研究着眼于植物乳杆菌YM 4-3菌株胞外多糖合成中参与寡糖重复单元的合成过程的两种糖基转移酶(orf1595及cps4I),通过对这两个基因进行敲除和回补,并结合基因敲除后菌株的转录
自上世纪七十年代初开始,我国管道运输业经过四十多年的发展,已成为现代五大运输体系的重要组成部分。作为我国能源产业链的重要一环,管道运输为国民经济和社会发展做出了重大贡献。原油计量作为管道运输行业中油量计算的唯一方式,是监控管道安全生产运行和保障国民经济利益的有效手段。在原油计量方法中,原油动态计量以其计量的可靠性和准确性成为了计量交接双方的首选计量方式。项目质量管理作为提升组织运行,优化产品质量的
随着世界经济的不断发展,人们对于环保的要求也越来越高,液化天然气(LNG)作为一种清洁、高效的能源,被越来越广泛地使用,同时越来越多的LNG储罐也被设计建造。运行中的LNG储罐一旦发生破坏,往往会造成巨大的经济损失,甚至人员伤亡。因此,对LNG储罐的安全性研究对工程设计制造有着重要的指导意义。此外,目前国内外还没有用于储罐强度计算的专用软件,结构计算都需要具备专业知识的人员来进行,使得项目进度缓慢
改革开放40年来,中国经济发展迅速,人民币在国际货币中的影响日益增强,人们对人民币汇率的关注也在不断的增加。中国汇率市场化进程的加快使得人民币汇率波动成为常态化,国内外学者对人民币汇率从理论与实践、宏观与微观等各个角度进行探讨和分析,而远期汇率的现实价格与其理论价格之间的一致与偏离是金融理论一直关注的一个重要问题。由于中国的人民币价格在很长一段时间内都与美元呈现出密切的关系,且近来的中美贸易战引起
位置采集技术的成熟使得获取移动对象轨迹数据,挖掘位置服务成为了研究热点,基于轨迹数据挖掘的位置服务已广泛应用于日常生活、商业决策、城市管理。通过轨迹数据分析人类的空间移动规、模式,进而发掘隐藏的深层次知识,已经成为信息学科的研究难点。本文的主要研究成果可以归纳为:搭建了基于马尔科夫链的位置预测模型。首先从历史位置数据中提取兴趣区(ROI),并基于大量的历史统计数据,用ROI来表征马尔科夫链的状态。
以氮化镓(GaN)为代表的第三代半导体材料因其带隙宽、热导率高、电子饱和漂移速率大、击穿电压高以及抗强辐射等诸多特色,不仅在蓝紫光电器件、全色显示和白光照明等领域独占鳌头,近年来更在高电压、高频率的功率电子器件和微波器件中异军突起,展现了相比传统硅基器件的多方面优势。但受制于同质衬底材料的匮乏,异质外延所带来的高缺陷和位错密度难以避免。而纳米材料则以其特有的量子限制效应、库仑阻塞效应、以及高的比表
失效模式及影响分析(Failure Mode and Effects Analysis,FMEA)作为质量管理中的一种衡量产品可靠性的分析工具,主要应用于事先的预防阶段及事后的改进阶段,通过全面分析产品的(潜在)失效模式及其原因,采取应对措施,从而避免失效问题的(再次)发生。随着FMEA方法得到广泛的认可与应用,考虑到人所处社会和经济环境的复杂性及其自身思想的局限性,决策者在进行评判时不仅具有犹豫
荧光化学传感器是一种操作简单、造价低廉、灵敏度高、并且能用于选择性识别金属离子的荧光性化学器件。铁元素是生物体内重要的微量元素,在环境和人体中的Fe3+含量必须保持