基于信息增益的软件特征技术研究

来源 :郑州大学 | 被引量 : 0次 | 上传用户:yj8888888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
软件产品是一种具有易复制、易篡改、易散布等特性的数字产品,使得软件盗版蕴含着巨大的经济利益。针对软件盗版在我国呈现猖獗势头,软件版权保护技术成为近年来软件开发商和学术界的研究热点。软件特征技术以自身所固有的属性或属性集作为研究对象,并采用特定的方法将其提取出来作为软件产品的唯一标识,是软件版权保护的重要手段之一。本文首先对软件特征技术的研究现状进行论述,在现有技术的基础上,然后针对SKB(Static k-gram based Software Birthmark)特征鲁棒性差的问题,利用信息检索时文本分类进行特征选择的思想,引入了一种新的软件特征选择方法--信息增益;最后又针对信息增益方法自身存在的问题和不足提出了解决方案。具体内容包括:(1)本文构建由盗版软件类别和无版权争议的软件类别组成的软件集,首先对软件集中每个软件进行静态分析,采用k-gram算法进行软件特征提取,由此得到的特征碎片集合维度高,采用信息增益方法对特征碎片集进行筛选和降维,去除冗余碎片,减少计算量,有效提升软件特征的整体性能。(2)信息增益方法选取的是在两类软件集中频数差别大的特征碎片,因此具有高信息增益的特征碎片是整个特征碎片集中具有最高区分度的碎片。但此方法仅考虑特征碎片在某类别中出现的样本数,忽视了特征碎片具体在软件样本中出现的频数,影响结果的精准度。其次,特征碎片的信息增益值越大,说明特征碎片在两类软件集中出现的频数差别越大,这将导致最终选出的特征碎片集可能会出现分布不平衡的问题。针对这些不足本文还考虑特征碎片类别频率(在所属类别中出现的频率)这一影响因子,对传统信息增益方法进行了改进。(3)进行设计实验,从可信性和鲁棒性两个方面对特征选择算法进行评估,并与两个典型的软件特征技术WPP特征和TaNaMM特征进行比较。从实验结果可以看出,本文提出的基于信息增益的软件特征,具有很高的可信性和鲁棒性,可以有效的检测软件盗版。
其他文献
西藏山南扎西康整装勘查区在大地构造上位于特提斯-喜马拉雅构造域中段的北喜马拉雅大陆边缘褶冲带内,其构造演化与特提斯洋的演化和印度大陆与亚洲大陆的碰撞作用密切有关。
涪陵地区志留系具备有利的生储盖条件,具有较好的油气勘探潜力。然而,对于涪陵地区小河坝组砂岩储集层成岩作用、物性特征的研究程度较低。因此在大量收集、整理和分析前人研
空腹梁是空腹夹层板结构的基本组成构件,具有自重轻、用钢量省、截面形式合理、承载能力高、经济美观等优点。但是目前对于空腹梁刚度的研究并不全面,且并无对其破坏机理方面
为了避免润滑油泄露和有害润滑油添加剂对环境的影响,开发在水润滑条件下工作的摩擦副材料具有重要意义。然而,水粘度与润滑油粘度相比有较大的差别,且水润滑条件下运动机构频繁运转于混合甚至边界润滑区间,导致摩擦副固-固接触承担相当甚至绝大部分载荷,这对摩擦副材料的使用寿命和可靠性带来严峻的挑战。聚合物及其复合材料具有自润滑性、高化学稳定性以及性能可设计性等优势,作为水润滑材料具有广泛的应用前景。本工作系统
现今,随着经济发展水平的不断提高和社会的不断进步,环境质量却不断下降,转变经济发展方式、实现区域经济协调发展以及经济的可持续发展已经成为大势所趋,其中,跨区域产业转
教材是教师进行教学、搞好教书育人工作的具体依据,也是学生获得系统知识、发展智力、提高思想品德觉悟的重要工具。母语教材体现着民族的传统文化、人文精神和科学理念等全
随着桥梁结构形式不断向轻型化、长大化发展,桥梁在结构上变为一种柔性体系,对风的作用极为敏感,桥梁抗风设计已成为桥梁设计的一个关键性问题。由于湍流求解的困难,一般只能
近年来,可恢复功能结构体系已逐步得到关注和认可,其理念是将地震作用下的结构塑性损伤集中在可更替构件并降低结构残余变形,从而实现震后快速恢复使用功能和减少震后修复量
目的从保护肝脏线粒体和调控内源性抗氧化酶系统两个角度,选用急性酒精性肝损伤大鼠、刀豆蛋白A诱导的免疫性肝损伤小鼠两种常用实验性肝损伤动物模型以及乙醇损伤人胚肝细胞
云南牟定地区位于康滇地轴中南段。康滇地轴位于扬子地台西缘,其岩石、地层、构造复杂,历来都是矿产资源研究的重点地区。该区铀矿化类型多样,对于该区混合岩的铀矿化一直是