【摘 要】
:
在当今世界,随着互联网与其他行业的迅速融合以及数据量的迅猛增长,用户通过分析海量数据中有价值的信息可以针对性地制定下一步发展策略,为了帮助用户快速、准确地分析出海量数据中有价值的信息,数据挖掘技术研究得到了越来越多的重视。频繁项集挖掘(Frequent Itemset Mining,FIM)是关联规则分析中最关键的技术,用户可以通过频繁项集挖掘分析数据中的有用信息,然而,传统的全量频繁项集挖掘技术
论文部分内容阅读
在当今世界,随着互联网与其他行业的迅速融合以及数据量的迅猛增长,用户通过分析海量数据中有价值的信息可以针对性地制定下一步发展策略,为了帮助用户快速、准确地分析出海量数据中有价值的信息,数据挖掘技术研究得到了越来越多的重视。频繁项集挖掘(Frequent Itemset Mining,FIM)是关联规则分析中最关键的技术,用户可以通过频繁项集挖掘分析数据中的有用信息,然而,传统的全量频繁项集挖掘技术难以面对当今世界快速变化的海量数据。当今世界下,产生的大量数据会使数据库动态变化,传统的全量频繁项集挖掘技术会产生大量冗余计算,适应性差、挖掘效率低。针对以上问题,本文所做的主要研究如下:针对传统的全量频繁项集挖掘算法难以适应快速变化的动态数据库,本文提出了一个基于Flink的增量更新模型Inc MU。该模型可以重用更新前数据库已有的频繁项集,只在新增事务数据集这部分增量数据集上执行挖掘过程。本文也在理论上证明了模型计算结果的准确性,以确保模型能为用户的正确决策提供有力依据。为了重用已有的频繁项集挖掘结果,本文提出了一种增量更新方法。该方法通过集合运算和查询项集支持度的方式,计算出更新后数据库中的全局频繁项集。尤其地,本方法通过更新项集支持度及时地移除不再频繁的项集,从而保持动态数据库中频繁项集的时效性。本文的增量更新模型具备一定的通用性,并在文中给出了适用于模型的频繁项集挖掘算法需满足的条件。本文将并行Apriori算法与增量更新模型相结合,以此为例具体介绍了实现过程,实验结果证明本文提出的增量更新模型相比于全量挖掘有明显优势,使用部分Webdocs数据集验证时性能优化率较高。
其他文献
在猪群中,猪圆环病毒(Porcine Circovirus,PCV)是常见的病原之一。该病毒的传播主要是由不同猪群间动物个体的流动引起的,PCVs也可能发生跨物种传播(如猪传染给啮齿动物、猪传染给牛、猪传染给毛皮动物等)。同时PCV在猪群中的阳性率很高,长期威胁着我国养猪业,阻碍着养猪业的经济发展。应用感染性克隆拯救病毒进而研究病毒的复制和病毒的致病机制是目前病毒学研究的常用策略。本研究在我国湖南
由于疲劳昏昏欲睡和分心而导致的危险驾驶是交通事故的主要原因,造成了重大的人员伤亡和经济损失,正在成为世界范围内日益严重的问题。因此,迫切需要通过准确检测危险驾驶行为和生成实时警报的系统来解决这一问题。在观察到各种危险驾驶行为会引起对声源信号作出响应的声学特征的启发下,本文提出了基于声学的危险驾驶检测系统。该系统准确地检测危险的驾驶行为,并使用现成的智能手机生成实时警报。与最先进的系统相比,本文不需
目前通信技术、大数据、AI、Io T、边缘计算等前沿科技在各行各业有着广泛的应用和良好的发展前景。由于这些科技的发展都离不开光通信作为基础的技术支撑,因此在信息通信系统中保持光通信网络的稳健性是当前面临的任务与挑战的重中之重。不言而喻,相对于曾经普遍应用的电缆通信技术,光通信网络已经是一种发展成熟、铺设便捷、节约成本、组网灵活、更强的可管理性、可靠性高的网络通信技术。如今,光网络通信技术已在世界范
消化道肿瘤的早期病灶较深且无任何明显症状,不易察觉,传统的内窥成像技术无法精确筛查、诊断出来。传统的消化道内窥技术大多采用白光成像,这种成像方式最大的缺点是只能观察组织的表皮,无法得到深度信息。除此之外,超声内窥成像只能分辨解剖结构的变化,无法探知早期的消化道肿瘤。因此目前专门针对消化道早期肿瘤的内窥成像技术仍有待开发。光声成像是一种复合型的新型医学成像方式,兼备了纯光学成像高分辨、高对比度和纯超
永磁同步电机(Permanent Magnet Synchronous Motor,PMSM)因具有功率密度高、转换效率高、体积小、响应速度快、转矩脉动小等优势,在工业各领域备受关注。PMSM无位置传感器控制技术可以省去机械式位置传感器,降低成本、提高可靠性,该技术在近几年发展迅速,已逐渐进入工业应用领域。然而无位置传感器控制技术也引进了新的问题——导致PMSM的带速重投难度加大。带速重投指的是在
经济飞速发展致使人们生活水平不断提高,营造健康舒适的建筑室内环境对人身心健康、以及各种资料或者文物的保存都非常重要,而室内温度和湿度在这方面起到的决定性作用也是决定性指标,但主动式调热调湿带来的往往是建筑能耗增加,出于目前能源紧张的情况考虑,也为相应节约能源的号召,凭借保温调湿材料来创造更为舒适的室内环境方面的研究越来越受到广泛学者的重视。本文出于对室内环境的保温调湿与节能两方面考虑,创新性地对一
天然水体中磷(P)含量超过一定水平时,会导致水体富营养化,影响水体的质量。磷是人类、动物和植物维持生物基本功能所必须的重要营养元素,与此同时磷是一种不能再生的资源,在自然界中的存在是非常有限的,磷矿的开采和流失造成了世界磷矿资源的严重短缺。根据研究表明,如果对磷的需求每年增长3%,世界上的磷储量将在未来100~400年内耗尽。从废水中回收磷不仅有利于缓解磷危机,而且有助于减少水污染和除磷负荷,这是
蛋白质是生命的物质基础。基因通过转录、翻译和翻译后修饰一系列过程才能合成结构复杂完整的蛋白质,进而对其功能的行使有着不可或缺的影响。作为一种重要的翻译后修饰,蛋白质S-酰化修饰(棕榈酰化修饰)通过将棕榈酸或长链饱和脂肪酸共价结合到靶蛋白的半胱氨酸残基上,从而在蛋白质胞内定位、运输、分选、细胞内信号传导等生物过程中发挥着重要作用。蛋白质的S-酰化修饰主要通过DHHC-CRD类棕榈酰基转移酶(DHHC
盾构隧道施工过程中不可避免地会造成周围土体扰动,进一步引发上部建筑物的受力变形,造成建筑物损伤。因此,盾构隧道下穿建筑物的风险评估也受到了人们的重视,成为了一个重要的研究课题。盾构隧道施工是一个复杂的过程,涉及到众多的影响因素。本文结合国内外相关研究和专家意见,充分挖掘分析盾构隧道下穿建筑物的风险因素,提出新的风险评估体系,并且将改进后的多准则评价方法首次应用于盾构隧道下穿建筑物的风险评估中,实现
新橙皮苷二氢查尔酮是一种具有强烈甜味的柑橘类黄酮衍生物,具有抗氧化、保护肝脏、抗炎和抗细胞凋亡等多种生理活性功能,目前已成为一种非常具有应用潜力的新一代甜味物质。由于新橙皮苷二氢查尔酮的水溶性较低,极大程度地限制了新橙皮苷二氢查尔酮的应用与推广。为降低新橙皮苷二氢查尔酮生产难度和成本,改善其水溶性,本文以柚皮苷合成新橙皮苷二氢查尔酮,并对合成新橙皮苷的关键步骤进行优化,讨论酸碱条件对此羟醛缩合反应