【摘 要】
:
在互联网技术飞速发展下,来自各行业的数据都呈爆炸式积累趋势。教育、医疗、科学及金融等领域数据的大爆发,已经推动大数据时代下数据挖掘等相关技术的发展。例如,在金融领域,包括金融信贷、信用消费评级、股票预测及信息验证等金融业务场景中已经充分渗透进大数据及其相关技术。由此可以看出,大数据在国家发展的过程中具有重要地位,大数据相关技术的发展及研究是现在时代下的需求和各界的关注热点。伴随数据挖掘和机器学习等
论文部分内容阅读
在互联网技术飞速发展下,来自各行业的数据都呈爆炸式积累趋势。教育、医疗、科学及金融等领域数据的大爆发,已经推动大数据时代下数据挖掘等相关技术的发展。例如,在金融领域,包括金融信贷、信用消费评级、股票预测及信息验证等金融业务场景中已经充分渗透进大数据及其相关技术。由此可以看出,大数据在国家发展的过程中具有重要地位,大数据相关技术的发展及研究是现在时代下的需求和各界的关注热点。伴随数据挖掘和机器学习等技术的快速发展,体育大数据的爆发给体育数据挖掘发展带来了挑战,现有的体育数据挖掘方法主要关注于提取和构造有效的基础体育数据特征,利用统计学方法并结合基础特征对体育数据进行分析研究,或采用早期传统方法来挖掘数据意义。体育运动数据的挖掘不能简单使用数据统计方法进行,如何结合机器学习和数据挖掘技术对体育运动数据进行有效挖掘和分析,从而对大众体育锻炼提供有益的建议,是一个迫切需要研究的问题。而通过特征选择算法进行体育运动效果研究是一种高效的体育数据挖掘研究。体育运动效果评价是分析评价体育运动对身体指标影响情况的客观存在。大量文献研究显示,大部分体育运动效果评估技术研究使用的数据集取自于国民体质监测公报,少量研究可通过采用问卷调查等手段获得。由于国民体质监测报告是在全国范围内同一时间通过抽样调查监测并分析研究国民体质的整体状况,该报告最终获得的数据是截面数据,以此数据作体质研究常常存在无法科学分析个体差异性的问题。另外,国民体质监测时间长,短期内获得的数据被重复使用进行研究,容易出现科研创新性不高的情况。因此,数据集的获取是体育运动效果研究需要解决的问题。围绕上述体育运动效果研究存在的难点问题,鉴于现有数据集和传统研究方法的局限性,本文从数据挖掘算法入手,构建了体育运动效果评价数据库,并基于特征选择思想,利用弹性网络算法、随机森林算法,开展了体育运动对身体指标影响效果的研究。本文的主要工作内容包括:1.构建了一个体育运动效果评价数据库。与体质研究所根据国民检测报告内容不同,本文选取785名青少年作为研究对象进行体育锻炼研究,收集真实训练数据,进行数据预处理、数据整理及数据标注工作,构建了体育运动对身体指标影响评估数据库SED(Sports Effect Datasets)。与现有数据相比,本文提出的数据库比国民体质监测报告具有更高的复杂性,有效地考虑了个体数据的差异性。同时,该数据库的发布,可为今后体育运动效果评价甚至体育运动数据挖掘方面提供数据研究基础。2.提出了一种基于弹性网络的体育运动效果评估算法。与传统体质研究方法相比,该评估算法引入了机器学习算法和特征选择算法来指导体育运动效果评价研究。在研究体育运动效果评价问题时,依据构建的体育运动效果评价数据库,加入弹性网络算法进行正则化优化实现特征选择,使得体质研究更具科学性,能够尽可能的揭示体育运动的效果情况。实验结果表明,选择出的特征和Ground-truth利用评价指标分析研究,与基准线方法相比,该算法具有较好的准确性。3.提出了一种基于随机森林的体育运动效果评估算法。与传统研究方法相比,该算法将特征选择算法运用到体育运动健身功效的影响研究中。在研究算法的特征选择能力时,使用信息增益指标进行特征重要性程度排序,可以科学准确地获得体育运动对不同身体指标的影响程度,能较全面地研究体育运动效果情况。本文选取SED数据库训练评估模型,实验结果表明,本文提出的评价方法与基于现有经典特征选择的评估方法相比,具有较好的评估性能及较高的准确度。
其他文献
显著性检测是计算机视觉领域非常重要的基础研究课题之一。在计算机视觉研究中,人类的视觉注意力机制对于理解图像或者视频中显著性物体起到重要的作用。通过人类的视觉注意机制可以在复杂的场景中相对准确且快速地发现和选择我们感兴趣的视觉目标。因此,如何更有效模拟人类视觉注意力机制高效提取显著性目标是当前计算机视觉非常重要的研究方向。随着深度学习在计算机视觉领域的广泛应用,众多不同的显著性检测方法涌现出来。虽然
待检测医学图像爆炸式增长,仅依靠人工识别的方式越来越难以快速、准确的检测图像中是否存在肿瘤。因此,医学图像处理技术迅速发展。在医学图像处理中,利用计算机快速准确地实现医学图像检测定位,能够帮助专家对病情更精确的掌控。其中,目标检测技术是一大重要组成部分。目标检测技术是对目标进行识别、检测目标行为的过程,每当符合检测要求的目标(如肿瘤)出现在图像中时,将其界定一个区域并预测其从属类别,从而快速准确的
随着计算机技术的迅速发展,图像成为了人们感知和认识世界的有效途径。但是由于图像在获取和传递过程中容易受到外界干扰而产生误差,让图像的后续处理变得很困难。因此,对于图像预处理(包括图像平滑、图像去噪、图像去模糊等)的研究尤为重要。其中,图像平滑的主要任务为:在平滑图像微小细节的同时保持图像的显著结构。图像去模糊的主要任务为:将模糊图像复原为清晰图像。目前,图像平滑和图像去模糊方法仍然存在图像边缘无法
随着近年来三维计算机图形学的快速发展,三维面部表情迁移技术得到了众多学者的关注。目前,该技术已广泛应用于计算机动画、影视特效、虚拟交互、远程网络会议等领域。三维面部表情迁移技术可以有效地避免动画师为新模型制作表情动画序列的繁琐工作,提高现有表情动画的复用率和新动画的合成效率,为高真实感表情动画的合成提供了新的途径和方式。一个好的三维面部表情迁移技术必须满足三个主要指标:表情迁移过程不需要人工干预;
在高速发展的数字化时代,数字图像早已成为视觉信息的主要传输媒介,人们对其质量的要求也逐渐提高。因此,近年来数字图像处理技术,特别是图像增强技术得到迅速发展,在多个领域得到广泛应用。例如,为了使视频更加流畅,需要对视频进行补帧以提高帧率,从而满足人眼视觉暂留特性的需要;为了分析大气和地面状况,需要对遥感卫星图像进行放大去模糊处理;为了侦破案件,需要对监控影像进行高分辨处理;为了更准确地定位病灶,需要
图像是生活中常见的一种视觉载体,其重要信息蕴含于某些特定区域。人类视觉系统能够快速且准确地获取图像特定区域中具有价值的显著性信息。在实际应用中,研究者们希望显著性检测算法能够像人类视觉系统一样自动捕获图像中的显著性信息。目前,显著性目标检测已经成为计算机视觉领域的一个重要研究方向,被广泛应用于图像分割、目标跟踪、图像检索等研究领域,具有较高的实用价值。得益于深度卷积神经网络强大的特征提取能力和特征
中医舌诊有着几千年的历史,早在《黄帝内经》中就记载了关于望舌诊病的内容。传统中医舌诊通过观察舌体特征来对人体的健康状况进行分析,是我国中医临床诊断的特色之一。由于传统舌诊是由中医医师肉眼观察患者舌体来进行诊断,这使得诊断结果比较依赖于中医医师的主观性和自身知识经验,中医舌诊缺乏定量化和准确化等客观标准。另外,传统舌诊的医师采用文字记录来描述病症,一些舌像资料和宝贵的诊断经验不能得到完整的保存和充分
一些关联规则挖掘(ARM)算法已经规定,发现数据项之间的亲密关系可以提高整体利润或导致有效的决策。然而,令人难以置信的数据存储激增导致了ARM算法的失败,从而给金融、工程和医学领域的ARM技术带来了挑战。在本研究中,我们通过分析以往的ARM技术,研究了在大型数据库的情况下,ARM所面临的挑战。我们遇到的问题是,由于技术的发展,互联网上的信息与日俱增,以往的ARM技术由于扫描ARM算法的无穷无尽而在
随着多媒体技术的发展以及图像获取设备的普及,图像已经成为人类传递信息的重要载体之一。然而在图像的获取、传输与存储过程中,由于受到采集方式不当或传输干扰等因素的影响,获取到的图像可能存在一定的数据缺失,这给以图像为基础的后续工作等带来了不便,所以需要对图像中缺失的信息进行修复,以改善图像的视觉效果。为应对图像的缺失类型各异这个问题,相应地种类的修复方法被接连提出。本文在研究这些方法的基础上,重点研究
雾霾天气时有发生,这会影响人们的出行和安全,同时空气中的悬浮颗粒会造成拍摄的图像质量大大降低,导致图像的可视性变差,对比度减低。图像在交通监控、海洋监测和卫星成像等方面有重要的应用,有雾天气下拍摄的图像严重影响图像的应用价值,以及分类和识别等计算机视觉任务的性能。因此,雾天图像清晰化已经成为近年来研究任务的热点问题。图像去雾的任务是恢复出清晰的图像,提高图像的质量。对于单幅图像来说,由于包含的信息