【摘 要】
:
随着信息技术的发展,越来越多的人开始关注数据科学,希望通过数据分析寻求有价值的数据信息。图表可视化技术作为数据分析的有效工具,可直观、清晰地呈现数据信息,但使用可视化工具创建可视化需要选定图表类型、坐标轴和数据属性等一系列较为复杂的操作,用户在该可视化探索的过程可能会致使数据分析效率降低。此外,现有的可视化工具对编程能力有一定的要求,即可视化工具的使用存在一定的门槛。为提升可视化创建的效率,本文提
论文部分内容阅读
随着信息技术的发展,越来越多的人开始关注数据科学,希望通过数据分析寻求有价值的数据信息。图表可视化技术作为数据分析的有效工具,可直观、清晰地呈现数据信息,但使用可视化工具创建可视化需要选定图表类型、坐标轴和数据属性等一系列较为复杂的操作,用户在该可视化探索的过程可能会致使数据分析效率降低。此外,现有的可视化工具对编程能力有一定的要求,即可视化工具的使用存在一定的门槛。为提升可视化创建的效率,本文提出一种基于数据驱动的多维可视化图表推荐算法。本文主要围绕多维数据可视化图表推荐问题进行研究,并将提出的方法在高铁故障数据分析中进行应用。针对基于规则的可视化图表推荐系统中出现的规则冗余、扩展难等问题,本文提出一种基于数据驱动的多维数据图表可视化推荐方法。该方法通过提取原数据集的相应的数据特征构建特征数据集,使用特征数据集训练推荐模型,实现对可视化类型的预测。提出类分解-生成对抗网络的数据平衡算法,旨在解决图表可视化推荐过程中数据的不平衡问题。数据采样技术虽然可以改善数据不平衡问题,但是在生成样本质量和保留数据信息方面仍存在一定不足。为了保证推荐结果的有效性,针对特征数据集中出现的样本类别不平衡问题,本文对多类样本进行分解并对少类样本进行合成。使用K-means聚类算法对多类样本进行分解,将多类样本分解为各不相交的簇,以降低多类样本在分类中的主导作用并避免了常规欠采样造成的数据信息损失。使用生成对抗网络对少类样本进行合成,使生成的样本符合数据分布的同时具有一定的多样性。考虑到特征数据集的维度较高,采用随机森林预测图表类型,将合适的图表推荐给用户,降低用户探索可视化的时间消耗,利于提升用户数据分析的效率和准确性。为了进一步验证本文所提出基于数据驱动的多维数据可视化图表推荐算法的有效性,针对高铁故障数据分析的实际需求,使用该方法完成高铁故障数据可视化。基于动车所高铁故障数据和业务需求,建立数据模型,使用合适的图表直观、清晰地展现高铁故障数据信息,帮助高铁工作人员快速准确地识别故障信息,提升故障维修效率,辅助其精准决策,为高铁安全运行提供了有效的智能化工具。
其他文献
进入21世纪第二个十年,我国开始进入了经济发展新常态,经济发展呈现结构转型的状态,其中农业现代化成为结构转型的重点工作之一。作为现代农业的重要组成部分,茶叶产业也步入新的发展阶段,产业内的横向和纵向整合也正在进行着。以四川省为例,作为全国重点产茶省,四川省茶叶品牌繁多,茶企数量众多;虽然产业整合正在进行中,但是从宏观层面来看多数茶企规模散小,管理落后,缺乏现代经营理念,商业模式趋于简单、朴实,以至
本论文以粉葛植株作为试验材料,研究腋芽再生途径、器官发生途径和体细胞胚再生途径粉葛组培苗再生体系的建立,通过比较这三条再生途径中粉葛组培苗再生的效率及难易程度,明确适合构建粉葛离体快繁体系的再生途径。同时,在此基础上,也系统研究了三条再生途径诱导粉葛组培苗的主要影响因素,主要研究结果如下:1、腋芽再生途径研究。以粉葛幼嫩枝条作为外植体,研究灭菌剂及表面活性剂对粉葛灭菌效果的影响;以粉葛幼嫩茎段作为
近些年来,小型旋翼无人机因具有垂直起飞,自由降落,侧飞,倒飞等一系列优点,可以在狭小地势,危险复杂环境中完成各种任务。因此,无论是在军用领域还是民用领域都获得了广泛的应用。然而,小型旋翼无人机在飞行过程中,常常受到外部扰动的影响,并且受高度或其它因素的影响而发生模型特性的改变,这些不确定因素将会影响小型旋翼无人机的姿态控制性能。本文研究的三自由度直升机可以很好地模拟小型旋翼无人机的关键动态特性,已
大部分锆、钛合金因耐热耐腐蚀性好、强度硬度较高等一系列优点而被广泛用于航空航天材料、船舶以及化学工业等领域,因此具有广泛的应用前景。然而,一般情况下锆、钛合金室温条件下塑性较差,容易在加工过程中产生开裂,需要在高变形温度及较低的应变速率条件下加工成形,热加工变形范围较窄,变形抗力太大,从而使其在各方面的应用大大受到限制。置氢处理是通过把氢作为锆、钛合金的临时合金化元素改善其相组成及微观组织,从而有
同时定位与建图(Simultaneous Localization and Mapping,SLAM)是移动机器人实现自主化与智能化的关键技术。相对于惯导、激光雷达等传感器,视觉传感器成本更低且采集的图像可以提供更多的环境信息,基于各种视觉传感器的SLAM算法取得了很多研究成果。然而,现有的视觉SLAM算法都假设相机在静态环境下工作,在实际应用场景中难免会出现运动物体,成为图像中的干扰元素,严重影
目前,铸件在机械产品中广泛应用,铸件内部缺陷问题严重影响产品质量,甚至会造成不可预估的损失。因此,铸件的品质检测成为工业生产中的关键环节。超声检测作为无损检测方法的一员,具有操作简便、检测灵敏度高以及对人和环境安全无污染等优势。针对现有的绝大部分超声波探伤仪均可直观显示缺陷扫描图像,因此如何通过图像识别方式在线检测铸件内部缺陷可行且必要。深度学习技术在图像识别领域中取得了十分显赫的成就,卷积神经网
在日常的生活以及大数据的实际应用中,通常需要对观测系统和实际生产中的数据进行记录,这些按照时间先后顺序记录的数据,就是基础的时间序列。当在系统中同时观测多个变量或同时记录多个数据,得到就是多元时间序列。研究时间序列的目的就是希望通过对时间序列的结构特征进行分析,挖掘其内部信息规律,最后能够正确预测时间序列的未来走向,并实现通过一定的人为行为进行调节,让系统按照期望的轨迹运行。相比一元时间序列,多元
随着电动汽车作为移动负荷的广泛接入电网,电动汽车负荷具有可移动性和不确定性,给配电网的调度带来了配电网峰谷差增加、网络损耗变大等诸多问题。针对电动汽车用户行为规律研究配电网的优化,对电动汽车的发展和配电网的稳定运行具有重要意义。本文以电动汽车分布式接入配电网的分层控制系统为框架,通过从时空特性分析电动汽车用户的出行规律,对电动汽车负荷进行优化预测,进而使配电网实现对电动汽车用户和电网双层优化,提高