基于序列模式挖掘的软件行为模式分析

来源 :燕山大学 | 被引量 : 0次 | 上传用户:axcom
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着软件规模的不断增大,对复杂软件系统的行为进行分析日益成为数据挖掘领域的热点。软件的一次运行对应一条执行轨迹,表示软件的一次行为,从大量的软件执行轨迹中挖掘出人们感兴趣的行为模式对于帮助解决软件缺陷定位、软件异常检测、测试用例的选择和约减具有重要的现实意义。从数据挖掘的角度来看,软件的执行轨迹可以看成软件执行序列,因此,结合序列模式挖掘,从大量动态软件执行轨迹中进行软件行为模式分析,相关工作如下。首先,从软件执行轨迹中提取软件执行序列,并从动态、静态两个角度出发,结合距离匹配和统计分析方法提出一种关键函数的度量方法,既可以识别出软件中的关键函数,又可以为下文研究提供参考。其次,提出了一种基于PT-tree的频繁模式挖掘算法,该算法将软件执行序列数据库压缩成一个树结构,并通过数据结构FNodesets存储PT-tree中每个节点包含的项集,利用集合枚举树作为搜索空间,并基于超集等价特性作为剪枝策略,提升算法的效率。再次,结合前文给出的关键函数度量标准以及函数之间的调用关系,提出了一种基于函数调用路径序列的高效用路径模式挖掘算法FHUPPM。根据关键函数的排名分配各函数项的外部效用所占的比重,设计了一种表结构PIUL用于存储模式的效用信息和位置信息,提出了UCMS矩阵结构,并基于该结构设计了一种高效用模式剪枝策略,作为相邻路径模式扩展的判断依据。最后,对提出的挖掘算法进行实现,基于Windows平台,通过java语言进行实现。并通过对比算法进行实验分析,验证提出的算法在运行时间,内存占用及可扩展性等方面的性能。
其他文献
API故障定位与传统故障定位主要差异表现在:API故障定位将软件失效点固定在了 API中的输出语句或者返回值语句,而传统的故障定位可以把程序中的每一条语句当作软件失效点。程
近几年来,随着科学技术的发展,图像视频发生了爆发式的增长。随之带来了巨大的存储和管理成本。虽然图像数量巨大,但图像间存在很大的相关性,特别是在相似度较高的图像集中。
随着城市化进程加快,我国城市地铁轨道交通的建设规模逐年增加。由于地铁建设大多处于城市繁华地带,地下管线繁多,周围建筑密集,隧道施工环境复杂、不确定因素众多,地铁隧道施工事故不断发生,造成了巨大的经济损失及人员伤亡,带来了不良的社会影响。因此,开展地铁隧道事故施工风险等级评价研究,对防范施工事故的发生具有现实意义。本文依托武汉某地铁隧道工程项目,分析地铁隧道施工事故风险特征,识别地铁隧道施工事故风险
在当今时代,物联网系统开始普及,进入人们的日常生活。人们在享受物联网服务带来的便利的同时,也因为物联网系统的安全问题承受着极大的风险。传统的物联网系统本地安全保障
软件定义无线网络(Software Defined Wireless Network,SDWN)作为5G移动通信网络发展的关键技术,增加了网络的可管、可控、可扩展性,优化了网络资源的调度,能够为用户提供可
随着信息技术的不断发展,物联网服务在生产生活中的应用越来越广泛。但是,物联网服务在给人们带来极大便利的同时,也存在着巨大的安全隐患。本文在传统入侵检测技术的基础之
随着互联网的高速发展,各种网站层出不穷,网页数据也呈现指数级增长。如果可以快速地对网页进行分析并提取出有价值的信息,将其提供给有需要的人群,会是一件十分有意义的事情
随着网络的日益普及,生活生产中随时会产生大量的数据,从海量数据中获取有用信息是人们遇到的一个主要问题,因此数据挖掘和知识发现技术显得越来越重要,其相关研究也越来越多
现今,微型光纤模态干涉仪(Miniaturized Modal interferometer,MMI)的应用越来越广泛,与传统的电子传感器相比,它们有许多固有的优点,例如:价格低、尺寸小、制作工艺简单、抗
全球经济文化迅猛发展的今天,国与国之间的交流日益频繁。为了满足信息获取的需要,外宣新闻成为国际间信息交流的窗口。很多企业为了拓展国外市场,也积极利用各种媒介开展对外宣传。多尼卡公司是一家民营高新技术企业,专攻航空电子设备研发。笔者实习期间在多尼卡电子技术公司从事微信公众号这一新兴媒体的外宣新闻翻译工作。奈达的功能对等理论的核心是关注语言的功能与读者的心理反应,这为外宣类新闻翻译提供了契合的指导方向