基于抽象语法树的程序代码抄袭检测技术研究

被引量 : 0次 | 上传用户:z196651j
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
抄袭是当前普遍存在的现象。近年来,该现象愈演愈烈,手段越来越隐蔽,有些人甚至对抄袭习以为常。在高等教育领域,因计算机类专业工程实践性的特点,要求众多课程围绕计算机进行实践教学与考核,而计算机上电子文本更易被复制及传播。国外有研究者曾针对澳大利亚蒙纳什(Monash)大学的程序设计类课程中程序代码抄袭现象进行调查,统计显示:高达85.4%的学生承认抄袭过他人的作业。这些问题的存在,已严重影响到学生能力的培养与教师正常教学的进行。程序代码抄袭检测技术能够高效快捷地发现有抄袭嫌疑的程序代码,有助于扼制学生不良学风的形成,保证教学质量与客观评价。本文就目前国内外现有程序代码抄袭检测技术进行了研究分析,提出了基于抽象语法树的程序代码抄袭检测方法。基本思路:借助GCC编译器为每一源程序分别构造抽象语法树,程序代码所包含的语义可以被解析至抽象语法树的各个结点中;由于抽象语法树包含许多有助于编译的细节信息,进而优化抽象语法树的结构关系,消除冗余结点,提取与程序有关的可用结点;之后进行可用结点解析,生成特征标记串文本,该标记特征串文本不再是一个线性串,而是一个含有丰富程序语义信息的结点集合;最后利用决策函数对特征标记串集进行相似性计算,完成代码检测。为了有效判定存在抄袭的程序对,还设定了相似性阈值自适应选取机制。在上述理论研究的基础上,设计并实现了一个基于抽象语法树的程序代码抄袭检测实验系统,该实验系统能够自动完成抽象语法树优化、结点解析和抄袭检测。以C语言程序代码为测试数据,并与MOSS系统的检测结果进行对比验证。实验表明,基于抽象语法树检测技术的上述试验系统,能够有效检测含有函数调用的复杂程序结构,并具有多种抄袭手段的程序代码。
其他文献
教会学校最初作为传教工具,是培养传教人和教育信徒子弟的场所。中国最早的教会学校可以追溯到1839年美国人布朗在澳门开办的马礼逊学堂(学界普遍认为)。教会学校从一开始就
期刊
4G最大非对称数据传输能力超过2Mbps,相较于3G通信有了较大提高。但随着移动终端多媒体应用的发展,尤其是视频、动画等大容量数据的移动应用,4G网路逐渐不能满足数据传输效果
尽管中央一再强调要人口的城镇化,而不要单纯的土地城镇化,但一些地方政府,为了某种"表面的光鲜与靓丽",仍在计划经济的思维和行为中,转圈圈,到头来,却让民众来"买单",这种不
住房是人们的安身立命最基本的物质元素之一,使人人能够安居、乐居也是和谐社会建设的重要内容。住宅产业作为国民经济的一项支柱型产业,不仅仅在拉动经济增长中起着重要的作
随着电子技术的迅猛发展,系统运行频率的不断提高,信号在PCB互连系统中正确传输越来越难,保证设计高速系统时的信号完整性已经成为影响PCB投板成功率的重要因素之一。高速PCB
本文以东亚飞蝗(Locusta migratoria manilensis(Meyen))为试虫,研究了温度与试虫生长发育的关系以及绿僵菌(Metarhizium anisopliae)侵染后试虫生理参数的变化,结果表明:15
目的建立一种研究离子通道的有效模型。方法采用Lipofacta mine2000脂质体将人的超极化激活的环核苷酸门控(HCN)基因转染人胚胎肾(HEK)293细胞,利用全细胞膜片钳技术检测克隆人HCN
税收工作是政府经济工作的重要内容,是政府统筹社会发展的重要杠杆和经济支撑。近年来,政府坚持依法治税,实现了税收逐年增长,但是税收增长的同时税收成本问题也越来越突出。
药品是一种特殊的风险产品,它承担着防病治病和保障公众身体健康的功能,但是受制于目前科学技术的发展水平和人们认知能力的局限,仍旧不能完全避免存在安全隐患的药品出现。