【摘 要】
:
现实中的很多问题可以转化为数据挖掘中的数据分类问题,这使得数据分类技术的应用领域十分广泛,例如商业保险、网络测量、气象预报、生物信息等。然而,随着信息技术的不断发展,各
论文部分内容阅读
现实中的很多问题可以转化为数据挖掘中的数据分类问题,这使得数据分类技术的应用领域十分广泛,例如商业保险、网络测量、气象预报、生物信息等。然而,随着信息技术的不断发展,各领域所积累的数据正在逐渐的膨胀,所以,如何提高数据分类技术的运行效率,是有效解决海量数据分类问题的关键所在。蚁群分类算法Ant-Miner是一种可以和经典的分类算法相媲美的分类技术,它基于群智能中的蚁群算法。然而,Ant-Miner没有充分利用蚁群的思想,并且它的启发式策略包含有局部信息。与蚁群算法不同,Ant-Miner的启发式函数值随着算法的运行而不断发生变化,增加了算法的计算复杂度。本文针对上述问题,主要做了以下工作:(1)概述了数据分类问题的定义、原理和实现算法,介绍了蚁群算法的思想来源、工作方法以及核心步骤,描述了蚁群分类算法的基本原理和改进方法的研究进展。(2)为了提高Ant-Miner解决数据分类问题的效率,提出了一种改进的蚁群分类算法mAnt-Miner+。该算法借鉴了mAnt-Miner的多蚂蚁构建蚁群的思想,并使用了一种新的启发式策略。在UCI数据集上的实验结果表明,mAnt-Miner+在不影响预测精度和规则简单性的情况下,提高了运行效率,并克服了mAnt-Miner早熟的问题。(3)将本文提出的mAnt-Miner+算法在零售企业会员分类中进行了应用。在会员数据集上的实验结果表明,在运行效率方面,mAnt-Miner+要高于Ant-Miner和mAnt-Miner;在预测精度和规则简单性方面, mAnt-Miner+与Ant-Miner和mAnt-Miner是可比的;然而,mAnt-Miner+克服了mAnt-Miner存在的不稳定性问题。并通过对发现的规则进行分析,获得了部分对零售企业有价值的信息。
其他文献
尽管工作流技术在软件开发活动中已经得到广泛运用,但是随着软件规模的扩大和软件需求的变更,工作流模型的柔性不足问题依然存在。为此,本文将构件技术与工作流技术相结合,提
随着国民经济的发展,各行各业对电力的需求不断扩大,如何提早预防、及时发现危害输电线路的自然灾害和意外事故,成为保障电力供应的一项重要基础工作。输电线路图像识别与自动报警系统采用图像技术对输电线路进行监控、分析和处理,能够对输电线路周围危害安全运行的目标进行自动识别与报警,为电力企业的科学决策提供依据,提升对自然灾害和意外事故的应对效率。本文首先论述了开发输电线路图像监控与自动报警系统的必要性,然后
随着传感器网络的研究和应用日益成熟,人类生活必将逐渐依赖于传感器网络,人类社会的发展也将离不开传感器网络。而覆盖问题就是无线传感器网络设计和规划需要面临的一个基本问
云存储正在因为它的可扩展性、方便性和低成本等诸多优点而变得越来越流行。它通过租用基本设施来提供对于文件的服务,包括允许用户在服务器上存储文件,同步位于服务器和用户
近年来我国突发事件频发,生命财产损失重大。如何快速安全地疏散人群具有重要意义。现有数据大都从真实的日常演习获得,突发事件中人群的行为和表现并不能完全真实的被反映。
随着电子商务的发展,出现了越来越多的用户到用户模式的双向推荐,传统个性化推荐的项目到用户的推荐已经无法满足用户的需求,这就催生了时下以在线交友网站为代表的互惠推荐
学习系统泛化能力的提升一直是机器学习研究的重点。单一分类器无法避免的局限和不足导致其分类性能的提升遇到瓶颈。集成学习作为新的机器学习模式,采用若干个单一分类器预
随着互联网技术的飞速发展以及国家对公共基础设施建设的大力支持,目前全国大部分地区已经实现了WiFi全面覆盖。然而WiFi网络的开放性使其极易遭受各种类型的攻击,比如嗅探攻击,恶意接入点攻击等等。最典型的场景是密钥分享,攻击者在室外接收到室内的WiFi信号,凭借着窃取来的密钥,他仍然可以获得接入WiFi的权限。究其根本,原因在于身份验证的范围远远大于实际合法用户的范围,从而给了非法攻击者与合法用户等
机会网络是一种新型的自组织网络,它的特点是节点间链路频繁断裂,整个网络通常处于不连通的状态,这样就导致传统无线自组织网络中的路由协议无法运行,所以在机会网络中节点通常采
伴随着网络信息技术的飞速发展,互联网+模式的迅速兴起,人们对于网络信息的获取与需求呈指数般增长。除了对文字信息的需求外,对于图像内容信息的认知与理解也逐渐为人们所重