小样本数据挖掘在泥土分类的应用

来源 :西安工业大学 | 被引量 : 0次 | 上传用户:wendell0408
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
法庭地质学是一门将地质学科的知识和技术应用到法庭物证当中的现代学科。其中泥土是重要的检验材料之一,通过对案件泥土物证的检验,判断泥土样品的来源,可以为案件的侦破提供线索和方向。国内相关部门对全国范围典型泥土数据量的收集较少,且对泥土物证的分析大多还停留在人工比对的阶段,因此本文在研究国内外相关理论的基础上,对实际的泥土样本数据的特点进行分析,设计了合理的综合分类流程算法,构建了一套针对泥土数据分类的法庭地质学多元数据智能分析系统,实现了对法庭地质学中泥土物证的多元指标综合分类,同时对泥土数据高维可视化进行了技术研究和系统实现。论文的主要工作如下:(1)在对当前国内外法庭地质学发展研究的基础上,对课题提供的泥土数据集的种类以及分布特点进行了分析,提出“散云团”分布的概念。并对常用数据挖掘技术、小样本增广技术进行了深入研究。(2)法庭地质学泥土样品数量有限,导致训练样本数量不足,出现了分类模型过拟合现象发生,严重制约了分类算法的准确性。通过分析现有数据增广算法的优缺点,提出了一种新的数据增广算法C-SMOTE算法,并与其它增广算法进行对比,分别以泥土的5类指标数据进行实验,结果表明使用C-SMOTE算法增广后的训练数据,可使分类准确率得到明显的提升。(3)传统的数据可视化往往无法满足对高维度数据可视化需求,论文根据泥土数据的特点,研究了高维度数据的可视化原理,包括平行坐标图、RadViz图等等,并且在Chernoff脸谱图方法中引入了信息熵的概念,提高了不同类高维数据可视化的区分度,为使用者更好的发现高维度数据背后隐藏的信息提供必要的技术支持。(4)泥土数据按其指标分为字符型数据与数值型数据。系统总体分类算法流程设计为先进行字符型数据分类,将待分类种类聚焦、减少;再进行数值型分类,采用C-SMOTE算法扩充训练样本数据集,提高分类器对每一种指标的分类准确率;最后根据集成学习的思想,采用投票选择的方式确定泥土样品的最终溯源结果。经过实验表明,该分类流程在C-SMOTE算法的基础上进一步提高分类的准确率。最后,本文采用软件工程的流程,对系统进行了需求分析、概要设计和详细设计,完成了法庭地质学多元数据智能分析系统的开发。
其他文献
战术通信网是一个极其复杂的系统,影响其可用性的指标多种多样,为了尽可能准确的对网络系统进行评估,必须建立较为合理的方法体系。本文针对战术通信网可用性评估的迫切需求,基于可用性理论,首先分析并给出了系统Markov稳态可用度模型,并对其有效性进行了仿真验证。在此基础上,考虑结合业务运行的性能需求,从“稳态可用度”和业务运行“性能指标达标率”两部分量化取值来对网络系统进行可用性效能评估研究。接下来,本
大量纸质历史文件的数字化复现管理,尤其机械零部件测试报表,对保障机械零部件长期稳定运行及故障预测管理具有重大意义。由于早期制表技术的欠缺,目前有大量的纵向框线为不连续虚线、框线错位、跨页等非规则表格,需要进行表格信息化批量处理,是构建设备信息化管理系统的关键所在。通过分析非规则表格本身特性,结合国内外针对表格研究的发展现状,从工程实际项目应用出发,利用QT设计了一套非规则表格有效信息智能识别系统,
随着人类基因组计划的发展,生物芯片技术成为一门前沿的高新技术,在生物检测的各个领域都有着广阔的发展前景。其中,免疫反应蛋白作为生物医疗诊断的一种常用检测指标,它对因细菌感染、炎症以及组织损伤引起的病症评估与疗效判断存在着重要的参考价值。为了能够直观、精确的分析出生物芯片上的样本中免疫反应蛋白的浓度以达到对疾病的诊断,本文设计出一套生物芯片测控系统。首先,本文通过对生物芯片测控技术的分析,结合系统的
超高层建筑液压顶升模架系统(简称“顶模”)作为一种机械化程度很高的造楼机具,被广泛应用于现代超高层的建设中。顶模作为超高层建设中物料堆积和人员施工作业的平台,它的发明和使用大幅提升了超高层建造的速度,而在现实工程建设中,顶模结构的设计往往会受设计人员工程经验的影响,设计出的结构经常存在结构安全偏保守、结构受力不合理、结构自重过大、耗材严重的问题,作为超高层建造技术的核心,顶模结构的安全和合理性直接
随着我国经济的快速发展和人口的稳定增长,机动车保有量始终处于持续上升的状态。各城市的交通部门对道路的规划和修建做出了 巨大的努力,然而,城市道路的负载能力依然无法承受交通流量飞速增长所带来的巨大的压力,因此,如何对交通流量进行合理和高效地疏导已经成为了一个严肃的问题。道路交叉口是城市道路网络中的关键部位,信号灯控制系统拥有疏导交通流量的重要功能,对其进行深入的研究能够有效提高道路的负载能力,并实现
随着光纤传感技术的发展,法珀腔传感器因其优越的特性被广泛应用在航空航天、桥梁大坝、医学研究等不同领域。法珀腔传感器通过对腔长变化信息的解调可以实现压力、温度等外界物理量的测量。SiC材料作为第三代宽禁带半导体材料,可耐高温高压,逐渐成为极端环境下法珀腔传感器的研究方向之一。对于SiC法珀腔传感器的实际应用而言,关键问题是准确提取法珀腔腔长值。由于SiC透光波段为可见光波段,而现阶段针对传感器的解调
深异形孔是深孔类零件的重要结构形式,因其可承受大转矩,导向性好、运动稳定性高等特点,广泛应用于矿山开采设备、航空航天等领域。针对深异形孔零件传统机械加工存在加工速率低、刀具损耗大,而电解加工具有阴极无损耗、无接触应力等优点,已成为制造深异形孔零件的有效技术手段。本文进行了深异形孔的电解加工关键技术研究,主要内容如下:针对深异形孔加工间隙流场不均匀导致工件收口及孔壁流纹问题,本论文以大深径比的异形孔
Al-Cu-Fe系准晶颗粒由于其优异力学性能和低热膨胀系数适合作为铝基复合材料的增强组元,以改善材料的热膨胀行为。本文首先采用普通铸造法制备Al63Cu27-xFe10+x(x=0,2,4)准晶合金,并研究热处理后准晶的微观组织,分析准晶相与热处理工艺之间的关系;对Al63Cu25 Fe12准晶合金进行球磨处理,以获得尺寸均匀的准晶颗粒;通过半固态铸造法,将Al63Cu25Fe12准晶颗粒加入70
曲轴综合测量机是基于坐标测量原理研制的一种高端数控精密测量设备,以其精度高、效率高、测量项目多等优点,逐步成为曲轴制造企业的关键检测装备。与传统坐标测量机测头前端采用的测球不同,曲轴综合测量机的测头前端采用了测板,在测量曲轴连杆颈时接触点沿着测板前端母线不断变化。曲轴综合测量系统的几何误差对测量结果的影响与传统坐标测量机也不同。因此,很有必要对其进行几何误差建模与误差敏感性分析,为曲轴综合测量机的
随着光学领域在科技发展进程中逐渐被受到重视,各行各业对光学系统及器件的需求也日益增多,光学系统的质量也随着现代光学制造技术的进步逐步提升,其中光学元件的面形质量作为决定光学器件成像质量的重要因素之一,其精度要求也逐渐提高,达到纳米甚至亚纳米级别。离子束修形作为近现代发展起来的确定性抛光技术,因其利用离子束作为去除刀具的去除特性,在光学元件的精密抛光中发挥着重要的作用。本文通过计算机仿真的手段,针对