基于粗糙集的分布式集值数据属性约简研究

来源 :重庆邮电大学 | 被引量 : 0次 | 上传用户:yuahhnet
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据类型的多样化,在实际的应用中,由于获取手段的限制或是实际问题的需要,我们获取到的数据很有可能是集值数据等非标准化数据。因此研究如何处理这类非标准化数据对更好地解决实际问题意义重大。与此同时,作为大数据的一种表现形式,分布式数据普遍地存在在许多实际问题中,但由于成本高、数据量庞大以及安全问题等因素的限制,在解决这类问题时往往不能将他们集中进行处理,这就导致了传统方法的使用受到限制。因此,如何有效地、分布地处理分布存储的数据是当前大数据研究中的一个热点问题。属性约简是数据预处理中的一个重要研究内容,它能够有效地约简掉数据中冗余的或是不重要的属性,从而加快后续对数据的处理进度,最终达到提高数据处理效率的目的。目前针对分布存储的标准化数据和不完备数据,已有研究者提出了相应的理论方法使得在保持系统约简前后分类能力不变的情况下对其进行有效地约简。但针对分布式集值数据的属性约简问题还有待研究。本论文深入研究了集值数据以及分布式集值数据的属性约简问题,主要内容如下:1.研究了析取语义背景下集值数据的属性约简。首先,提出了一种基于概率的相似关系来衡量两个集值对象之间的相似程度,克服了现有方法的局限性。然后,针对集值决策信息系统提出了一种相应的基于正域的属性约简算法。实验结果表明该方法可以有效地简化集值决策信息系统且分类准确率也比现有方法有所提高。2.研究了分布式集值数据的属性约简。首先,定义了分布式集值决策信息系统下的粗糙集模型。然后,在保持系统的正域不变的前提下讨论了系统中属性的可约简性,并提出了分布式集值决策信息系统下基于正域的属性约简算法。实验结果表明该方法可以在保持系统分类能力基本不变的情况下有效地去掉系统中的冗余属性。
其他文献
近年来,随着第五代移动通信系统(Fifth Generation Mobile Communication System,5G)的快速发展、人工智能(Artificial Intelligence,AI)技术的不断成熟以及工业产品的需求升级,工业制造需以工业物联网(Industrial Internet of Things,IIoT)技术为基础,将制造业向以智能制造为主导的“工业4.0”转型,旨在
近年来,生物特征识别技术由于其高可靠性和高有效性在用户身份认证领域受到了广泛关注。作为生物行为特征的一种,在线手写签名具有不易遗忘、采集方便且容易被人们接受等特点,在无纸化办公和电子商务等领域具有广阔的应用前景。但是由于手写签名的不稳定性,用户真实签名之间存在较大的类内差异,而真实签名和伪造签名之间的类间差异相对较小,使得在线手写签名认证研究具有一定的挑战性。本文以此为背景对在线手写签名认证算法进
现如今社会中几乎各个领域,每时每刻都会产生大量形态各异的流数据,这些数据产生的速度极快、数量极大,基本上无法被全部存储,因此对于日益增长的流数据而言,在线学习算法的
子宫内膜异位症(endometriosis,EMs)是一种常见的良性妇科疾病,以疼痛和不孕为主要特征,严重影响了生育时期女性的生活质量。近年来随着辅助生殖技术(assisted reproductive tec
研究背景及目的:布鲁氏杆菌是一种常见的人畜共患性细菌,是布鲁氏菌病的病原体,其不仅影响了畜牧业的发展,也危害了人类的生命健康。本研究以慢性布鲁氏菌病患者为研究对象,
模糊规则分类器能有效克服符号规则缺点,且更容易表达和理解,成为分类算法的研究热点。大数据环境下,丰富的数据源使得数据表达更为复杂含糊,高维、稀疏的数据加剧了模糊规则
目的:近来多数研究将组织工程材料与干细胞或因子复合来改善动物脊髓损伤模型损伤处的微环境,以增加作用时长、提高恢复效果与预后。本研究旨在探究:1.制作音猬因子(SHH)-聚
目的:创伤性脊髓损伤(spinal cord injury,SCI)是中枢神经系统难治性外伤疾病,具有较高的致残率和病死率,因无法解决受损脊髓组织神经电信号通路连接等问题,目前没有很好的治疗
[目 的]通过检测中缅边境地区云南省西双版纳州景洪市、缅甸克钦邦拉咱市和掸邦第二特区勐冒县恶性疟原虫氯喹抗性转运蛋白基因(Plasmodium falciparum chloroquine resistan
一般而言,多标签学习与单标签学习最大的区别在于,多标签数据的标签被组织在一个标签向量中,而且标签之间往往具有很复杂的关联信息。层次多标签分类是一种特殊的多标签分类