关联规则挖掘算法及其应用研究

来源 :西安理工大学 | 被引量 : 0次 | 上传用户:electron999
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关联规则挖掘是数据挖掘的一个重要领域。在关联规则挖掘的过程中,反复的I/O操作必定影响了挖掘的效率。减少I/O操作的主要方法是减少事务数据集的扫描次数或减少候选项目集的个数。本文针对Apriori算法的不足之处,通过综合考虑制约算法效率的各个因素,建立了一种改进的Inter-Apriori算法。该算法充分利用了 Apriori算法的优点以及矩阵运算的特点,通过对矩阵的行和列进行压缩,能在稠密度不同的数据库类型中表现出良好的伸缩性。本文的主要研究成果如下:  ⑴建立了一种改进的Inter-Apriori算法。该算法是一种基于定位和权值事务项集的挖掘算法,只需扫描一遍事务数据库。该算法利用垂直型布尔矩阵来存储交易数据,通过“与”运算与权值来计算支持度,利用定位搜索和合并事务矩阵相同列来剪枝,从而减少了算法在挖掘过程中使用的存储空间和计算时间。文中通过实例给出了改进后的算法流程,从理论分析和实验测试两个方面对Inter-Apriori算法和改进后的算法进行了分析比较,说明了改进后的算法优于Inter-Apriori算法。  ⑵将关联规则挖掘应用于商业银行贷款用户是否违约的研究分析。利用商业银行贷款用户的逾期记录信息,利用关联规则挖掘的算法Inter-Apriori算法和改进后的算法进行挖掘,一方面,验证了改进后的算法性能;另一方面,挖掘出商业银行用户逾期贷款之间的关联关系。通过分析这些关联关系挖掘找到了商业银行贷款用户是否违约的影响因素,从而可以为商业银行贷款业务的发展提供科学依据。
其他文献
本文根据高职《混凝土结构》课程教学目标的要求,针对教学现状中存在的问题,提出任务驱动式的项目教学法,给出了具体的教学设计和实施方案,希望通过教学改革,提高学生的实践能力,为
随机样条是随机多项式的推广,这对于研究自然界中以随机方式变化的事物的特定规律来说,又增添了一种有力的数学工具.   自然界中以随机方式变化的事物一般用随机函数来描
学位
本硕士论文主要讨论n维欧氏空间中凸体的非对称性度量。在总结前人工作的基础上重点研究了常宽凸体的Minkowski非对称度。首次给出了平面常宽凸体的Minkowski非对称度的最佳
本文首先在基于内积空间上矩阵Padé-型逼近[23]的基础上,讨论了基于内积空间上矩阵Padé-型逼近表的块状结构特征.为了提高求矩阵Padé-型逼近解的精度和稳定性,本文接着提出了
第一类Fredholm积分方程广泛应用于自然科学、工程技术及经济学等领域,但由于其本身的不适定性,使得对其进行研究有诸多困难。如何有效的求出第一类Fredholm积分方程的数值解,一