电信数据挖掘技术研究——模糊关联和周期性数据聚类的研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:xxx12
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着我国电信运营商为了适应飞速变化的外界环境进行自我的不断改革和发展的同时,电信运营商之间的竞争也演变得越来越激烈,这也给电信运营商带来了更大更多的发展机遇。电信运营商发展至今积累的海量的客户消费数据,隐藏着能够指导电信运营商更准确地进行企业决策的知识。而发现大量的数据中发现隐藏的有价值的信息,对现在的电信运营商更好地在竞争中服务客户具有重要的意义。数据挖掘正是从帮助人们从大量数据的传统分析中解放出来,提供了另一种更智能、更高效也更有成效的从数据中获取知识的技术方法。   本文主要做了两部分工作,包括模糊关联和周期性数据聚类两方面的研究。第一部分探讨数量型属性在区间划分上存在的划分过硬问题,引入模糊关联规则的问题。本文对现有的模糊关联规则算法选取了其中三个算法进行了分别的总结和比较分析,包括基于AprioriTid的模糊关联规则算法FAMA、基于FP-Tree的模糊关联规则算法FFP-Tree和基于线性链表的关联规则挖掘算法FMA-LL,并用实验比较了几个算法之间的优劣性,验证了FMA-LL在模糊属性处理问题上的全面性和在算法效率上的高效性。在已有的FMA-LL算法的基础上,从线性和非线性两方面解决隶属度函数的确定问题。CURE算法利用聚类得到的中心构成模糊集,GA算法将函数参数编码经过多次遗传操作得到最优模糊集,再确定线性函数。FCM和GA_FCM算法是采用分治对每个属性模糊聚类产生对应的隶属矩阵,根据聚类中心和隶属矩阵来逼近正态模糊函数,得到正态隶属度函数。采用adult数据集做实验进行分析,实验证明CURE、GA和GA_FCM在隶属度和算法效率上各有优势。第二部分分析现有的对时间数据序列进行聚类分析的方法。现有的聚类算法通常从相似性度量的方面进行改进,但往往忽略时间序列数据周期性和连续性的特点对聚类算法的影响。本文对此问题进行了分析,尝试采用延拓的方法来解决该问题,从而改善聚类的效果。本文通过初步的实验结果表明了该方法的可行性和有效性。
其他文献
随着科技的发展,自动化水平的不断提高,薄型带状物料的生产已经基本实现了自动化。而带材在开卷到卷取的传送过程中,由于受到各种物理因素的影响,容易发生跑偏现象,从而会使生产线
工程应用中,在入口较小且内部空间较大的封闭环境中作业的现象越来越多。如飞机内部载荷装置安装、太空舱内部载荷机柜安装以及动车内部装置安装,这些都需要将载荷装置从外部搬
无损检测(NDT)技术就是在不损坏或不影响被检测对象使用性能的前提下,利用声、光、磁、电等特性来获取材料的某些特性,这也是无损检测技术越来越受到重视的主要原因。   脉
随着开关电源飞速的发展,其高频化、数字化和绿色化已经成为人们关注的焦点,然而由于在大多数电力电子装置上仍然采用不可控整流桥后加大电容滤波的输入方式,导致输入电流导通角
近年来国内的物联网技术得到了飞速的发展,智能家居是物联网应用技术的一个重要分支。随着科技的发展智能家居逐渐成为人们对住宅的一种新的需求,人们对家居生活环境的要求也
意识障碍是指人们对自身和环境的感知发生障碍,或人们赖以感知环境的精神活动发生障碍的一种状态,主要表现为意识内容和(或)觉醒障碍。意识障碍是临床上比较常见的一种疾病。目前
风电场装机容量的增加,使得风力发电系统并网的稳定性越来越受到重视,那么就必须考虑电网电压跌落期间风机对电网稳定性的影响,要求风电机组具备低电压穿越能力,防止当电网电压跌
精密定位技术作为微观领域研究的关键技术之一,其技术水平直接影响到微观领域的研究水平。微行程精密定位技术虽然发展得比较成熟,但大行程精密定位技术由于具有更大的定位行程,所以其应用范围更广,也更具有研究意义与价值。本论文旨在设计一套基于潘式压电马达的二维毫米级行程纳米位移台装置,能够实现毫米级行程的纳米级精密定位。论文综合分析了微行程精密定位技术以及大行程精密定位技术的国内外研究现状,描述了潘式压电马
空间光通信技术要求调制信号必须具有大功率、高速率的特性,才能在远距离通信中保证信号的高保真和大数据量高速传输。这使得大功率、高速率调制技术成为解决这一问题的关键。