大数据中效用挖掘的快速单阶段算法

来源 :电信科学 | 被引量 : 22次 | 上传用户:mazipeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现有数据挖掘算法的缺点是在挖掘大数据时会出现大量候选模式,从而造成可伸缩性瓶颈,个别算法虽然不生成候选模式,但是计算代价高昂,缺乏有效剪裁,运行效率存在瓶颈。为此,提出一个全新的单阶段不生成候选模式的数据挖掘算法,其创新性有3点:一是基于前缀生长的模式枚举和基于效用上限值评估的剪裁策略;二是基于稀疏矩阵和虚拟投影的效用信息表达;三是节省存储空间的深度优先搜索方法。大量实验表明,新算法的时间效率比现有算法高5倍以上,并且内存使用量比现有算法少20%~60%,可伸缩性高。
其他文献
本文主要介绍奥西波夫研究验证奥西波夫方程的方法和论点
针对广电接入网边界缺乏安全防护措施的现状,提出一种面向融合网络的广电接入网入侵检测系统,并实例化为SunGnet703,可检测并实时阻断进出接入网边界的各类网络攻击。系统具有"非配合"部署、高可靠性运行、"隐形"确保自身安全、全维数据分析4个特点,可为广电接入网边界提供一种简便易行的安全防护方法和实际系统。
目前基于机器学习的入侵检测系统大都建立在入侵数据始终保持统计平稳的假设之上,无法应对攻击者有意改变数据特性或新型攻击方式的出现,而导致的检测率下降的状况。对于上述问题,即攻击漂移,提出了加权Rényi距离的检测方法。在KDD Cup99数据集上的实验证明,Rényi距离可以有效地增强检测效果;在检测到漂移后,通过重新训练模型可以使得对攻击的识别率显著提高。
为了解决LEACH协议中由单跳路由算法造成的节点能量消耗不均衡的问题,首先,计算分析得出簇间多跳的最优跳数,得到簇头节点到基站的一条理想路径;然后,提出一种环形搜索方法去寻找与理想路径最接近的最优路径;最后,提出了簇头到基站的多跳路由算法。仿真实验结果表明,簇头到基站的多跳路由算法较LEACH协议在均衡节点能量消耗和延长网络生命时间方面的性能有明显的提高。
传统二维有源天线仅能进行水平维波束调整,而三维有源天线能进行垂直维波束调整,提升系统吞吐量。现有的三维有源天线波束下倾角选择方法是基于俯仰角信息进行选择的,用户信号接收功率较低。为此,提出一种新颖的三维有源天线基站组网波束下倾角选择方法,该方法基于参考信号接收功率信息进行波束下倾角选择,有效提高了用户信号接收功率。仿真结果表明,新方法可大幅提升小区平均吞吐量,改善系统性能。
针对当前算法主要对拓扑构建或拓扑维护单独研究的问题,提出了一种将两个过程组合的拓扑控制算法,可以适应于通信和能量异构的网络。拓扑构建以较少的通信开销构建连通支配集,而拓扑维护由sink节点基于时间、能量或故障机制执行局部或全局修复策略以节约能量。理论分析和仿真实验证实,算法能以较少的时间和通信开销构建拓扑并延长网络生命时间。
设备间通信(D2D通信)通过复用蜂窝通信的频带资源,可以使近距离的用户直接通信,而无需通过基站进行中继。它的引入可以提升用户的服务质量,降低终端能耗,拓展小区的覆盖范围。特别的,在CDN场景中,可通过移动中继向请求相同业务内容的用户进行D2D广播传输。但是,在上述场景中,需考虑到移动终端(MT)的能耗和与蜂窝用户之间的同频干扰问题。基于此,提出了一种基于粒子群优化(PSO)算法的联合中继节点选择和
针对多用户正交频分复用系统自适应资源分配问题,提出一种改进的子载波和基于差分进化算法的功率自适应分配算法。该算法首先在均等功率下进行子载波分配,然后通过添加约束条件检测改进步骤,改进差分进化算法,并采用该算法根据设置的兼顾用户公平性与系统容量的目标函数,全局寻优实现用户间的功率分配。仿真结果表明,算法在低算法复杂度及兼顾用户公平性的情况下实现了较高的系统容量提升,证明其有效性。
为了解决服务链部署中的路径循环和源地址绑定问题,首先,提出一种新的服务链部署方法,该方法利用Open Flow多级流表标识服务链及服务顺序,从而使数据分组按照需求的服务顺序正确处理;其次,提出服务链部署算法以实现服务路径到流表规则的映射;最后基于Net FPGA-10G完成了原型系统实现。仿真结果表明,该部署方法具备可行性,并降低了流表数量和时间开销。