【摘 要】
:
序列型数据中的趋势特征是序列数据挖掘研究中的重要研究对象,其基本研究问题包括:趋势的表述与识别、趋势的相似性度量、趋势聚类、趋势预测等。本文针对序列数据挖掘中的趋
论文部分内容阅读
序列型数据中的趋势特征是序列数据挖掘研究中的重要研究对象,其基本研究问题包括:趋势的表述与识别、趋势的相似性度量、趋势聚类、趋势预测等。本文针对序列数据挖掘中的趋势发现问题,研究趋势描述、识别、发现方法,具体研究成果包括:(1)提出了基于惯性现象的趋势表述以及趋势识别方法。揭示了序列中“前序节点对后续节点的发展变化有重大影响”这一惯性现象是趋势的内涵本质,从而通过“惯性”重新界定了“趋势”;在考虑“重叠趋势”的情况下,提出了对序列数据中蕴含的趋势子序列自动识别的“惯性检验”方法,利用实验说明了传统趋势基元表达力的不足。(2)针对趋势之间由于长度、规模、形态等差异,难以直接进行相似性度量的问题,提出了基于复合弯曲距离的趋势相似性计算方法。该方法基于结构计算序列数据相似性,借助演变函数的数学特性,实现对趋势进行“平移”、“序弯曲”以及“值弯曲”的操作,将趋势变换为最接近的形态,提出了序列“演进过程同构”、“演进过程逆构”概念,结合序列关键点理论,降低了相似性计算的复杂度。在此基础上,使用改进了的曲线积分距离,完成趋势相似性计算。(3)针对多维关联规则发现问题中的维选择、离散化、布尔化问题,提出了基于趋势事件的多维关联规则发现方法。通过将维中的事务当作节点形成序列视角下的事务维,结合趋势识别结果,进一步构造“趋势事件序列”;“基于复合弯曲距离的层次聚类”方法被用于合并趋势事件的数量;梳理“时滞”的类型,给出了关联规则发现应用中计算最优时滞系数的方法。
其他文献
本文介绍最近我国台湾油脂工作者研究的一种防止食用大豆油色泽加深的有效方法。该方法首先对整粒大豆用蒸汽处理1.5min,有效地抑制大豆酶活性,然后用常规方法制油、脱胶、脱
对浸出溶剂在浸出过程中的流动状况做出定量分析,并指出降低溶剂消耗的措施。
<正>病例资料一、支气管异物以小儿多见,成人少见,但误诊率高,多为认识不足,近年我科收治3例,报告如下:病例1:患者卢某,女,20岁,室内装潢设计师,因"咳嗽、咳痰2周,伴活动后胸
营业税改征增值税试点是在为未来的税制改革探路;增值税与营业税分别是中央和地方的主体税种,营业税改征增值税试点为进一步完善分税制财政体制改革提供了契机;改革试点实际
构建精细化税源监控体系,应实行税源分类管理,促进税源监控对象精细化;严密过程监控,实现税源监控内容精细化;整合资源,凸显税源监控方式精细化;坚持创新,探索税源监控方法精
随着中国经济对外开放的脚步越来越快,中国商业银行国际贸易融资业务的发展前景也越来越广阔,成为商业银行业务体系中的重要组成部分。对于现在的商业银行国际贸易融资业务来
本文从标准化的视角,阐述了我国农村生态环境保护标准体系构建的重要意义,分析了农村环境控制、农村生态保护等内容与标准化对象,阐明了农村生态环境保护标准体系构建原则,绘
目的探讨支气管肺泡灌洗液(BALF)对内镜检查阴性的周围型肺癌患者的诊断价值。方法选取我科2011年1月至2014年7月住院行支气管镜检查镜下阴性的患者共114例,进行支气管肺泡灌
目的探讨成人支气管尖锐异物钳取的技术要点。方法选取分析我院5例成人支气管尖锐异物钳取经过及临床资料。结果所例举的患者4例局麻手术、1例全麻辅助喉罩通气下手术,取出异
从地籍动态管理的角度,提出了土地与宗地全生命周期的概念。基于此,设计了地籍时空数据结构,探讨了面向全生命周期的地籍时空管理系统的结构和功能,并将研发的系统运用在实际