论文部分内容阅读
近年来,数据挖掘技术研究引起了国内外人工智能和数据库领域专家的广泛关注。关联规则的挖掘是其中一个重要的研究方向,在许多商业应用中都取得了十分理想的效果。在电信行业中,随着通信市场竞争的加剧和市场的日益饱和,现有用户的价值提升和消费潜力挖掘已经成为运营商市场经营的首要工作,一种基于关联规则挖掘的新兴营销方式——交叉销售正是适应了这种变化。本文首先分析了现有的模糊关联规则和正负关联规则挖掘算法的特点和存在的问题,针对不足之处提出改进方法,并提出了一种新的模糊正负关联规则挖掘算法(FPNAR),然后针对算法给出了用于实际电信项目的例子,分析了FPNAR算法在电信行业交叉销售应用的可行性。本论文主要研究工作概括如下:首先在数据预处理中,采用了一种基于聚类中心点的模糊离散化方法。该方法主要分两层实现:首先对待离散化数据进行聚类,得出其聚类中心点;然后根据各类中心点确定隶属度函数参数,并通过隶属度函数离散化数据。基于聚类的模糊离散化方法充分利用了数据集的分布特征和分类信息,实现了数据的智能离散化,克服了因人为制定隶属度函数参数错误导致的挖掘结果错误。其次在建模过程中,在现有的正负关联规则挖掘算法的基础上,本论文采用一种多重最小支持度的方法,有效控制频繁项集和非频繁项集的数量,保证了挖掘规则的数量和算法的效率,并结合最小相关性系数约束,剔除了大量无意义规则,提高了挖掘结果的质量。在标准数据集的仿真中取得了较好的效果。最后,在本文中详细介绍了一个具体的电信行业数据挖掘分析实例——某市电信小灵通套餐业务的营销推广分析。开始全面阐述了交叉销售的概念,并提出了基于关联规则的交叉销售模型,最后通过对小灵通客户业务消费的历史数据进行挖掘,实现了小灵通各业务之间的关联分析,并对交叉销售模型的实证结果进行了详细的讨论和分析。