【摘 要】
:
随着计算机技术、网络技术、信息技术的飞速发展,数据在人们生活中所占的比重越来越大,但是怎样能从这些数据中挖掘出对人类生产生活真正有用的信息呢?这个问题受到越来越多
论文部分内容阅读
随着计算机技术、网络技术、信息技术的飞速发展,数据在人们生活中所占的比重越来越大,但是怎样能从这些数据中挖掘出对人类生产生活真正有用的信息呢?这个问题受到越来越多的关注。粗糙集是数据挖掘中一种研究不确定性问题的数学工具,是目前人工智能理论及其应用领域中的研究热点之一。如今粗糙集理论在许多领域都得到了成功的应用,但粗糙集理论仍有一些问题值得进行更深一步的研究,如粗糙集本身没有确定如何建立一个精确集合作为目标集合的最优近似集,没有给出如何计算目标集与其近似集之间模糊相似性的方法,以及经典粗糙集理论应用于数据挖掘的聚类中存在一定的局限性等,本文主要针对粗糙集中存在的以上几个问题进行了研究:首先,对于经典粗糙集只能通过两个清晰的边界(即上近似集和下近似集)作为目标集合的近似集,并没有明确给出在现有的知识粒中如何确定不确定目标集合的近似集的方法,针对这些问题引入了粗糙集的一种扩展模型——粗糙集的近似集模型。在本文中,用经典度量相似性的方法——欧式距离来计算目标集合与其近似集之间的模糊相似性,随后具体的分析了0.5-近似集的特征和性质,结果表明0.5-近似集是所有可定义集合中目标集合的最优近似集。其次,本文详细分析了数据挖掘中目前比较经典的相似性度量方法并分别说明在何种情况下使用哪类相似性度量方法比较合适。在数据挖掘领域,相似性度量是解决很多问题的基本条件。如在粗糙集近似集的研究中,相似性度量是最终确定该方法能否精确刻画目标集合的近似集的基础。而在数据挖掘的分类或聚类问题中,相似性度量也是研究该问题的基础条件。因此在本文中首先总结了目前数据挖掘中经典的相似性度量方法并且说明在不同的数据集或要完成不同目标的情况下应该选择哪类相似性度量方式。最后,针对粗糙集的另一种扩展模型——变精度粗糙集,本文开展了关于变精度粗糙集对于数据挖掘中聚类方法的实际应用研究。数据挖掘中传统的模糊聚类算法对于噪声点比较敏感,从而造成聚类的精度不高,针对此问题本文提出了一种基于变精度粗糙集的模糊聚类算法,此算法根据粗糙集的原理将待划分的数据元素分别划分到正域、负域和边界域三个域中,然后根据变精度的思想和数据特征确定阈值,再将边界域中的元素进行划分。最终通过仿真实验对该算法进行了实验和分析,表明该算法可行有效,进一步促进了粗糙集扩展模型的发展和应用。
其他文献
由于不断发展的科学技术和不断深入的信息化建设,现代网络的规模已经越来越大,到了不能忽略其能耗的地步。据估计,现在信息通信技术(ICT)中的能耗约占全世界各类能耗的1-2%,
作为中国证监会最早批准的创新试点资格的券商和综合类券商,华泰证券股份有限公司经过20多年的不断发展壮大,现已经成功在上海(代码:601688)和香港(代码:HK6886)挂牌上市。华
本研究通过室内抑菌试验,筛选出对新疆棉花苗期主要根腐类病害立枯病和红腐病的致病菌活性较好的杀菌剂,并通过筛选悬浮剂、增稠剂、成膜剂等助剂及种衣剂加工工艺研究,制备
随着首次公开上市发行的再次重启,我国上市公司的数目不断增长,上市公司重组的事件也随之呈增长的趋势。而反观重组的绩效,受制于样本选择的差异和研究角度、方法的不同,一直
伴随着通信技术的飞速发展,大量诞生于不同应用场景的无线通信技术不断涌现出来,同时由于移动互联网的高速发展,使得单一制式的网络无法满足用户日益增长的业务需求。随着多
在高性能处理器领域,受到功耗、互联及复杂度三大因素的限制,处理器计算性能的增长速度已经无法满足摩尔定律,异构并行的加速方式将引领新的发展方向。在嵌入式领域,ASIP技术
目的:研究催眠术在局麻手术中的应用,并探讨催眠术在局麻手术中应用的安全性、可行性。证明催眠术可有效地辅助局麻,达到满意效果,提高患者手术麻醉的舒适性。方法:研究取得所有患者知情同意,且通过天津医科大学肿瘤医院伦理委员会批准,2017年8月至2019年6月,选择在天津医科大学肿瘤医院进行乳腺肿瘤切检手术的患者,患者均愿接受催眠治疗且为催眠易感患者,根据斯坦福催眠感受性量表筛选出催眠易感患者,患者均为
在生物信息学研究中,生物序列比对是其基本组成和重要基础。序列比对的基本思想是基于生物学中序列决定结构,结构决定功能的普遍规律,将核酸序列和蛋白质一级结构上的序列都看成由基本字符组成的字符串,目的是找出序列之间的相似性,发现序列之间的内在联系,进一步探索生物序列中的功能、结构和进化的信息。如今随着生物数据库规模的爆炸性增长,序列比对过程的复杂性也迅速增加,导致计算时间的大量增加。为加速生物数据库的搜
无线传感器网络是由大量传感器节点通过无线通信方式形成的一种多跳、自组织网络。为了保持监测对象的高保真度和原始数据的实时连续性,监测区域内的传感器节点会不间断地采
Intel MIC协处理器作为近年来一种新的异构计算平台,由于其基于现有的X86架构的特点,同时支持OpenMP、OpenCL、pThread等多种并行编程模型,越来越多地被应用在高性能计算领域