基于决策树与K-means混合分类模型的大学生体质研究

来源 :第十二届全国体育科学大会论文摘要汇编——专题报告(体育统计分会 | 被引量 : 0次 | 上传用户:ssssssfs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
国民体质的提升既是国家社会经济发展的结果也是促进国家进步发展的重要动力。大学生是国家的栋梁,也是民族的希望,大学生体质健康的程度可以说将直接影响国家未来的兴衰。因此,大学生体质健康的提升和促进一直是各高校密切关注的重点问题。目前绝大部分的高校对学生的体质健康数据只是进行简单的统计分析,并以数据库的形式将数据进行储存,缺少对数据进行深度分析,无法对学生体质的提升起到良好的促进作用,也无法针对本校学生的特点和需求开展体育教学。为了解决上述问题,加上对之前相关研究的思考,本研究选取某大学2020年本科生体质健康测试数据,对数据样本进行K-means算法的聚类分析,并根据聚类结果训练决策树模型,通过模型分析不同类别学生的体质特征,以便于运动处方的制定。聚类分析是要将大量的数据样本按照一定的规则进行分配,将数据分成若干个"簇",同簇之内的元素尽可能相似,不同簇之间的元素尽可能不同。进行聚类分析时使用的方法不同,得到的结果也不一样,需要根据研究的需求来选择合适的方法。K-means算法是一种典型的基于划分的聚类算法,通常以距离作为评价相似性的标准,即认为两个对象之间的距离越近,其相似度就越大。K-means算法是一个最优化求解问题,在目标函数中寻找一个全局最小点,进而解决数值型属性数据对象的聚类问题。K-means算法的计算速度快,计算量小,耗费时间少,对具有凸特性的数据集有着非常好的聚类效果。同时K-means算法思想也比较简单,容易使用。决策树是一种比较常见的机器学习方法,通过对训练集中的数据所表现出的特征及属性进行总结分析,找到一个可以确切描述与分类这些特征及属性的模型,并且借助该模型可以对未来获得的不可预测的数据进行分类。同时,决策树算法也是一种归纳学习的算法,为了得到一个泛化能力强的决策树模型,来对数据集进行总结分类,基于不同的数据,使用不同的分类标准,不断对数据进行决策分类,使得决策树分支结点的"纯度"越来越高,直到最后无法继续进行分类。常见的决策树分类算法有ID3算法、C4.5算法、SLIQ算法、CART算法等。本研究选取某大学2020年学生体质健康数据作为样本集进行研究,包含大一、大二、大三、大四四个年级共7933人。该大学学生体质健康测试的开展、评分等完全按照《国家学生体质健康标准》进行。在进行数据预处理后,对于男生,选择肺活量分数、50米跑分数、1000米跑分数、立定跳远分数、坐位体前屈分数、引体向上分数、总平均分这7个字段作为输入字段进行聚类;对于女生,则选用肺活量分数、50米跑分数、1000米跑分数、立定跳远分数、坐位体前屈分数、仰卧起坐分数、总平均分7个字段作为输入字段进行聚类。聚类后根据评分的平均值由高到低的顺序,将聚类结果分成四类:优秀、良好、一般、较差。将聚类结果算出后,选择CART分类树算法建模,代入决策树模型,生成男生七层决策树模型和女生七层决策树模型。根据决策树模型可以分析出不同类别的学生分别具有以下特征:1.聚类结果为优秀的男生的特点:(1)1000米跑分数大于98分,(2)立定跳远分数大于69分,(3)引体向上分数大于78分。2.聚类结果为良好的男生的特点:(1)1000米大于45分,(2)坐位体前屈大于68分,(3)引体向上大于45分,(4)50米跑大于82.5分,(5)身高体重大于70分。3.聚类结果为一般的男生的特点:(1)50米跑大于55分,(2)引体向上小于45分,(3)身高体重大于70分,(4)立定跳远大于25分,(5)1000米跑大于45分。4.聚类结果为较差的男生的特点:(1)引体向上小于25分,(2)立定跳远小于45分,(3)1000米跑小于45分。5.聚类结果为优秀的女生的特点:(1)坐位体前屈大于90分,(2)50米跑大于75分,(3)一分钟仰卧起坐大于95.5分,(4)肺活量大于77分,(5)立定跳远大于75分,(6)800米跑大于77分。6.聚类结果为良好的女生的特点:(1)坐位体前屈大于32分),(2)一分钟仰卧起坐小于95.5分大于55.5分,(3)肺活量大于77分,(4)立定跳远大于75分。7.聚类结果为一般的女生的特点:(1)50米跑大于25分小于77分,(2)肺活量小于92.5分,(3)800米跑大于25分小于77分,(4)立定跳远大于15分。8.聚类结果为较差的女生的特点:(1)立定跳远小于55分,(2)50跑小于55分,(3)800米跑小于25分。基于决策树与K-means混合分类模型可以帮助高校对学生体质进行分类,在不依靠外界标准的前提下,对校内学生体质进行分类评估;同时借助决策树模型,分析出不同体质水平的学生的体质特征,找出优势与不足,还可以对比校内学生与《国家学生体质健康标准》的差距,从而帮助学生快速、科学、高效地提升体质,促进身体健康。
其他文献
《普通高中化学课程标准(2017年版)》中提出"模型认知"是化学学科核心素养之一,同时《初中科学课程标准(2011版)》实施建议中提到"帮助学生学习建立科学模型,逐步养成质疑、反思的科学思维习惯"。可见,模型认知是科学(化学)学科的核心素养之一,模型的建构是感性思考与逻辑思维之间的桥梁,在课堂上利用模型开展教学,可以帮助学生深层次认知核心概念,学会通过分析、推理等方法,认识研究对象的本质特征
期刊
在新课程理念的影响下,高中地理教学模式发生了很大的变化,传统的教学模式越来越不适应高中生的全面发展。因此地理教师也要首先从自己做起,改变传统落后的教学理念,创新自己的教学方法。随着社会的不断向前发展,社会对人才的要求升级,很多行业都迫切需要更多的创新型人才,是否具有创新能力是立足于行业的重要标准。当前的高中地理教学要求学生在掌握知识的基础上,运用所学知识去解决问题,而解决问题就需要培养学生的
期刊
党组织是引领社区多元共治的关键核心,但是社区党建如何发挥引领作用,其中的作用机制尚待深入研究。近邻党建是社区党建的一种创新探索,其特点是基于邻里共享的社区公共空间发挥党建作用。以空间理论为分析视角,将社区公共空间分为物理公共空间、社会公共空间和精神公共空间三个维度,并以福建省开展近邻党建的21个社区作为案例,运用多案例分析方法,得出结论:近邻党建通过优化社区物理公共空间,拉近多元主体距离;链接社区
通过对田东县英竹水文站不同水位级的实测流量测验成果进行单值化分析,对不同的统计时段单值化流量产生的误差影响程度进行分析统计,以保证水位流量关系曲线的推流精度。
土方调配设计常采用线性规划方法,以达到缩短工期和降低成本的目的。当挖填区数量较多时,利用LINGO线性规划软件进行土方调配设计,操作简单,结果准确。以某大型土方场平工程为例,介绍了基于LINGO线性规划软件的土方调配设计方法,其应用情况良好,有效缩短了工期,降低了成本,取得显著效果。LINGO是交互式的线性和通用优化求解器,可用于求解线性规划及非线性规划问题,其功能强大,代码简单,操作方便,值得推
从亲水性和细胞相容性、力学性能、熔体强度和耐热性、降解速率、抗菌性能等几个方面对聚乙醇酸(PGA)及其改性研究进展进行了综述,同时简述了其在生物医用、食品包装、油气开采和农业生产等领域的应用情况。
关于发展中国家在WTO框架下享有的特殊与差别待遇的争论由来已久,并随着多边贸易体系的进一步发展,变得更加复杂,其重要性也越来越突出。发达国家与发展中国家对特殊与差别待遇的改革持完全相左的意见,矛盾十分尖锐。为解决目前胶着的该项改革僵局,推动多边贸易体系的发展,本文基于各方面的改革方案,立足中国的特殊地位,提出兼顾发展性与一致性需求的折中方案。
种子是农业的“芯片”,种业是国家战略性、基础性核心产业。党的第十九届六中全会通过的《中共中央关于党的百年奋斗重大成就和历史经验的决议》(以下简称《决议》)明确指出:“党始终把解决好‘三农’问题作为全党工作重中之重,实施乡村振兴战略,加快推进农业农村现代化,坚持藏粮于地、藏粮于技,实行最严格的耕地保护制度,推动种业科技自立自强、种源自主可控,确保把中国人的饭碗牢牢端在自己手中。”这是《决议》总
期刊
建筑工程行业近年来快速发展,但在其施工阶段中法律问题频发,必须严肃对待。建筑工程施工阶段人员较为混杂,施工人员的法律意识淡薄,常出现的法律问题包括施工单位违法分包、施工安全事故、施工质量不符合要求以及拖欠农民工工资等。提出了建筑工程施工阶段中法律问题的解决对策,应当从强化法律责任意识、明确劳务分包规定、抓牢施工安全保障措施、强化施工质量监督和检测以及加强监管和法律援助力度上进行。