一种基于相关系数加权的离散型数据填补算法与分析

来源 :现代电子技术 | 被引量 : 0次 | 上传用户:psobb045
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为解决具有关联性数据的缺失值问题,提出一种结合相关系数与相似性匹配作用于离散型数据填补缺失值的方法。首先,在非缺失数据源中挖掘频繁项集并计算数据属性间的相关性,计算出挖掘项的项内整体的相关性;然后,根据缺失数据所在项的非缺失前项与完整数据挖掘项的相似度选择填补项;填补项相似性一致则利用加权置信度进一步选取填补规则,一方面提高了Apriori挖掘规则集合的数量及质量,另一方面也保证了规则匹配的可靠性。经实验与相关方法比较,该方法提高了缺失数据填补的准确率与时间效率。
其他文献
针对传统蚁群优化算法难以找到全局最优的物流配送路径,物流配送的时效性差等缺陷,为获得理想的物流配送路径,提出基于改进蚁群优化算法的最优物流配送路径设计方法。首先,对
研究了光声信号声速失配时所起的声折射对光声成像的影响,提出了利用与组织声速匹配的耦合液进行光声成像,并配置了几种适合于组织声速的超声耦合液。实验结果表明,进行声速匹配
伴随着监狱体制改革的实施,金昌监狱党委从自身做起,不断增强“领导就是吃苦、就是服务、就是奉献”的思想观念,坚持下基层调研和联系点制度,做到“情况在一线了解、感情在一线融
报纸
针对现有VXI-11协议在Windows下的开发都过于简单,功能严重不完整,且仪器在启动VXI-11服务时需要引入很多代码,操作过于繁琐等问题,完成了VXI-11协议在Windows下完整功能的开
目的探讨结核感染T细胞斑点试验(T-SPOT.TB),对诊断菌阴肺结核的临床应用价值。方法选择60例菌阴肺结核患者为实验组,20名门诊健康普查者为对照组,两组同时作T-SPOT.TB试验和
<正> 特发性肉芽肿性乳腺炎(IGM)是乳腺的一种罕见的慢性炎症性疾病,1972年首先由Kessler氏报告,迄今报告不足百例。我院曾收治1例,现报告如下,以期提高对本病的认识。患者女
以往循证实践模式少有考虑临床实践的复杂性[1-2],针对护士的护理实践亦缺乏。在此背景下,Johns Hopkins大学护理学院和附属医院护理部共同开发了Johns Hopkins循证护理实践(
提出一种不需要专用相移装置实现相移,主要利用数字图像处理技术实现三维面形测量的方法.研究结果表明,用原干涉图像及1幅以上的移值条纹图就可能实现物体三维面形的测量.
针对人脸具有对称性特点,提出了基于对称性与方差的快速分形人脸图像压缩算法。在编码时,对某值域块,将定义域块限定在与其对称的候选区内,如在其中未找到匹配定义域块,则再扩大候选区范围。对基于方差方法与本文算法在时间复杂性上的分析表明,即使在最坏情况下,利用本算法所需编码时间也仅为基于方差方法的1/2。通过在ORL和YALE人脸库中的实验表明,利用本文算法,在基本保持恢复图像质量的同时,平均编码时间仅为
基于分数傅里叶变换与菲涅耳衍射的等效性和线性系统理论,给出了菲涅耳衍射系统在分数傅里叶变换下光学传递函数的数学表达式,分析了其基本特征,阐述了其物理意义,证明了常规傅里