【摘 要】
:
本文对驾驶行为特征进行了关联规则挖掘,以改进的K-means算法和改进的Apriori算法为主要研究目标,并使用标准UCI数据集和泰迪杯数据挖掘大赛中的驾驶行为数据集来验证算法的有效性。首先,将驾驶行为数据进行预处理,对异常数据进行清洗和删除,防止脏数据对挖掘结果的影响。由于Apriori算法本质上只能挖掘离散型数据之间的关联规则,而驾驶行为特征参数在空间上是连续的,因此根据K-means算法对驾
论文部分内容阅读
本文对驾驶行为特征进行了关联规则挖掘,以改进的K-means算法和改进的Apriori算法为主要研究目标,并使用标准UCI数据集和泰迪杯数据挖掘大赛中的驾驶行为数据集来验证算法的有效性。首先,将驾驶行为数据进行预处理,对异常数据进行清洗和删除,防止脏数据对挖掘结果的影响。由于Apriori算法本质上只能挖掘离散型数据之间的关联规则,而驾驶行为特征参数在空间上是连续的,因此根据K-means算法对驾驶行为数据进行聚类,划分结果将作为后续驾驶行为数据离散化的依据。直接运用传统的K-means算法对驾驶行为特征参数进行聚类,会导致聚类结果不稳定。针对这个问题,提出一种基于决策值选取初始聚类中心改进的K-means算法。该算法以局部密度和相对距离两种度量准则为基础,构造样本的二维决策值图;算法能够自动选取决策值最大的数据对象作为初始中心点,保证了聚类稳定性。实验结果表明,改进算法比K-means算法更加稳定,迭代次数减少,在真实数据集上聚类性能优异。最后利用改进的K-means算法对驾驶行为片段进行聚类,根据轮廓系数得到最佳聚簇数为3。因此,将驾驶行为划分为危险型、急躁型、稳定性三类,其中危险型占比18.35%,急躁型占比25.65%,稳健性占比56%。其次,为了挖掘驾驶行为特征参数之间的隐含关系,将离散化后的驾驶行为数据作为关联规则挖掘的输入变量,并提出了一种基于布尔矩阵约简的Apriori算法,通过扫描事务数据库,将其转化为布尔矩阵。在生成频繁项集的过程中,根据最小支持度约束约简矩阵。最后利用UCI标准数据集和驾驶行为数据集对提出的算法进行了性能验证,实验结果表明改进算法在运行时间和内存消耗上都要优于传统的Apriori算法。最后运用基于布尔矩阵约简的Apriori算法进行驾驶行为的关联特征挖掘,得出危险型的驾驶行为主要存在多次的超速行驶、疲劳驾驶、急刹车等不良驾驶习惯。本文提出的基于聚类和关联规则的算法能够准确地挖掘出驾驶行为之间存在的关联关系,在理论和实验中都证明了改进算法在驾驶行为的分析和决策上具有使用价值。
其他文献
复杂网络作为近几十年科学领域的新兴研究领域之一,受到了国内外广大科研工作者的广泛关注。总体而言,有关复杂网络的研究大致可以分成从微观角度和宏观角度两个研究方向:从微观角度的研究主要是从个体特性出发,研究复杂网络中的各个节点与网络特性的动态关系;从宏观角度的研究则主要从全局出发,利用图论、概率论与统计学的思想分析全局网络的动态和稳态特征。在近半个世纪的研究中,科研人员们结合代数图论、概率论、控制理论
机器视觉检测技术因不易受环境条件影响,生产成本低,安装灵活,只用在相机里安装对应的检测模块即可等优势,被应用于越来越多的领域。图像内容表示模型是机器视觉检测过程的重要环节,图像内容表示模型的不同构建方式影响机器视觉检测的应用场景。本文从应用于工业领域产品缺陷检测的角度出发,提出一种基于混合高斯的表示模型。现有的图像表示模型较多直接以检测目标为整体建模或需要大量的矩阵运算,存在对检测目标较小的细节变
坡度频率分布是定量化研究地形坡度分布的一种常用方法,以全球陆地为研究区计算坡度频率分布,能够为进一步了解地球表面地形坡度分布特征提供信息,并为相关地学研究提供一个标准统一的参照系。本研究首先从空间分布和频率分布两个方面对比了现下主流30m分辨率DEM数据集:ASTER GDEM v3.0和SRTMGL1 v3.0,对坡度表达的稳定性,并最终证明了30m分辨率下SRTMGL1 v3.0数据产品更适用
同一场景可以通过多种传感器捕获多幅图像,每一图像包含不同信息,图像融合技术就是整合多个图像的互补信息,使融合后的图像对场景描述更加全面和清晰。如今,图像融合技术已广泛应用于遥感探测、医学诊断、国防安全、工业检测等领域。然而,现有融合技术仍然存在一些亟待解决的问题。比如,当要融合的图像受损时,现有的融合方法无法在融合处理过程中恢复出丢失信息。通过图像融合和矩阵完备的逐步操作可部分恢复图像的丢失信息,
发动机作为汽车的核心部件,具有类型繁多,结构复杂、零部件数量多等特点,其维修是汽车维修过程中的重点和难点。在发动机故障维修工作中,存在故障原因查找困难、零部件结构认知不准确、维修操作过程不规范、维修效率低等问题,仅依靠维修人员的维修经验和查询维修手册等传统方法很难保证发动机故障准确高效的维修需求。目前针对发动机故障维修主要依靠电脑诊断软件故障和维修人员依据故障现象和经验查找硬件故障这两种方式,而在
髋关节发育不良是一种在青少年和成年人群中常见的骨关节疾病。正常人的髋臼髋关节中心与股骨头中心近似重合,由于髋臼的发育缺陷导致髋臼的深度变浅、坡度变大从而使股骨头与髋臼的接触面积越来越小。髋臼与股骨头之间的受力面积减小,接触应力峰值增大,进而产生应力集中。应力集中会造成关节软骨的过度磨损,损坏关节软骨,最终发展成为髋关节骨性关节炎。髋臼周围弧形截骨术是治疗髋关节发育不良的一种新型的治疗方式。目前国内
铜电解是铜冶炼过程中的重要工艺,常因多方面电解工艺因素的影响,致使阴极铜板表面出现结瘤缺陷,严重影响其表面质量。考虑到在人工识别该缺陷的过程中,受内、外多方面因素的干扰,致使操作人员对铜板表面结瘤缺陷结果产生误判,影响最终决策合理性。针对上述问题,本文提出一种结合混沌鸟群算法的铜板结瘤缺陷图像识别方案,旨在提高企业生产的智能化,同时降低生产成本。主要工作如下:(1)分析了不同视角下采集铜板图像的差
赋有可变二维码的烟标因其在防伪溯源、宣传营销等方面的优势正逐渐成为主流的烟草包装形式。随着印刷企业赋码作业规模的持续扩大,其生产质量不稳定,印刷精细程度无法保证的缺陷越发突出。针对此问题,本文基于目前印刷企业中烟标可变二维码的整体喷印流程,首先进行了可变二维码喷印过程的数值模拟及墨滴形态的分析;其次进行了二维码喷印工艺参数对二维码符号等级的影响研究;最后对烟标可变二维码喷印质量优化进行了实验研究。
车联网(Internet of Vehicles,Io V)是一种因特网在车辆领域的应用。车联网的基础是车载移动互联网,并通过相关的通信协议相互连接的大型通信网络。在智能交通领域,Io V是最重要的组成部分。Io V负责将车辆相互连接起来,以达到消息共享、消息通信的目的。由于Io V开放的特性,攻击者可以截取实时广播的信标信息,通过分析所截取的信标信息获取驾驶人员的习惯、车辆运行的轨迹、驾驶人员的
近年来,深度学习的应用不仅在图像识别、文本生成等领域表现突出,在自然语言处理方面也效果显著。自然语言处理系统在生活中比比皆是,比如手机智能助手在理解用户请求之后,就能通过文字或语音的方式反馈用户信息。人类之间主要通过语言的方式进行沟通交流,以达到知识分享、扩展人际关系等目的。然而,目前全球在使用的语言超过五千种,要想精通多门语言是一项艰巨的任务。此时,机器翻译作为自然语言处理领域中的一个重要分支部