论文部分内容阅读
随着各类宽带接入网用户的迅速增长,以及市场竞争日益激烈,各大通信运营商们开始日益重视面向宽带用户的商业信息推广服务。由于所需推广的商业信息庞大且繁杂,如何对相关数据进行高效处理,提高其推送的效率与针对性,成为各大通信运营商巩固市场竞争力的有效途径。例如,研究如何针对不同的固网宽带业务用户群,实现差异化的电信产品推荐服务,并应用于电信宽带客户信息推送系统中,即为当前电信运营商的研究热点之一。本文对现有宽带客户信息推送系统的推送数据与推送模式进行分析与研究,熟悉电信待推荐产品的数据特征以及现有推送模式的不足;其次,研究关联规则数据挖掘理论,并深入研究分析基于多维与项目压缩的,适合电信推荐产品数据特征的Apriori改进算法;然后,针对推荐数据量的指数式增长导致的算法性能局限性问题,提出基于云计算Hadoop平台的并行化挖掘MR_AprioriDpc算法,并将其应用于电信产品推荐的关联规则挖掘中。最后,将挖掘结果应用于宽带客户信息推送系统,并设计和实现相关的功能模块。本文主要创新:(1)基于电信产品推荐,设计具有关联规则分析、推送任务定制以及定制推送统计三个功能的定制推送功能模块,并在电信宽带客户信息推送系统中予以实现;(2)针对Apriori算法的不足,深入研究与分析基于多维的、项目压缩的Apriori改进算法;并针对其对海量数据的性能局限性问题,提出基于云计算Hadoop平台下的并行化MR_AprioriDpc算法;(3)建立推荐产品关联规则挖掘模型,并将MR_AprioriDpc算法应用到电信推荐产品关联规则挖掘中。