基于样本冗余控制的材料属性机器学习预测模型

来源 :科学技术与工程 | 被引量 : 0次 | 上传用户:yjcwo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前基于机器学习的材料属性预测研究中,通常采用数据库获取的所有数据样本,通过计算其高维向量表示来训练预测模型。然而材料数据库样本的高冗余性导致了训练的模型具有很强的偏向性和过拟合的现象。为此,提出一种剔除数据集中冗余性样本的算法,从数据集中选择具有代表性样本;通过使用多种机器学习算法预测材料属性并进行比较,结果表明如果没有实行基准数据集的冗余控制,即使是随机原始数据集也可以由于高冗余样本而得到很好的预测性能指标;研究还发现使用具有代表性样本进行训练实际可以帮助训练出具有更高泛化能力和更具预测性的模型。因此
其他文献
新企业所得税法已于2008年1月1日起正式实施.如何深刻理解新企业所得税法的精髓.有效规避企业的涉税风险,是税收筹划必须考虑的问题。本文主要从税收筹划空间的变化提出了税收筹
本文运用经验研究法,以我国零售业50多家上市公司219个样本。对该行业股票收益率决定因素进行实证分析。较之以往研究,本文作如下改动:前研究表明市场风险系数始终未表现出对股
内部财务制度是企业管理制度的有机构成部分,现代企业管理中完善财务制度防范财务风险的基础。文章认为,现代企业制度的财务管理模式应是建立以财务预算为前提,以资本管理和成本