论文部分内容阅读
由于化石能源的枯竭以及对环境造成严重的污染,光伏能源作为一种新型、廉价且环保的可替代能源,对于社会生产生活各个领域都具有极其重要的意义。美国于201 1年通过的材料基因组计划(Material Project)和我国于2018年通过的材料云计划(Material Clouds)都将机器学习在新型光伏材料中的应用纳入国家重点发展计划之一。然而,由于现存的材料学相关数据不足,数据来源可靠性低,数据格式不统一等问题,导致机器学习强大的数据处理能力无法在新型功能材料的分析与设计中充分的发挥。因此,在研究初期阶段,结合机器学习与材料学的相关知识,对用于材料性质预测的数据集进行有效的筛选和处理非常必要。本工作选择近几年来发展最为迅猛的光伏材料,金属氯化物钙钛矿,作为研究对象,重点研究稳定无毒的无机非铅卤化钙钛矿。工作重点在于基于材料的基本理化性质及其之间的相互作用关系对原始数据集进行筛选,在此基础上对表征化合物理化性质的特征进行处理与筛选。为提高计算准确性,本工作从材料性质特点出发,对初始数据集进行初步筛选,并利用GBRT模型和Shapley模型评估筛选结果,发现材料的组成元素、晶体结构、以及1维描述符ι对带隙预测的准确性能起到决定性作用;材料的组成元素对钙钛矿形成能预测结果的准确性影响最大。随后,使用Sharpley Additive Explanation对模型的预测结果进行解释分析。对于带隙预测,B位原子的电负性(BElectronegativity)具有最高的Sharpley特征重要性且与预测值呈负相关关系;对于形成能预测,B位原子的电负性(BElectronegativity)与X位原子的第一电离势能(XFirstIonizationPotential)具有较高的Sharpley特征重要性,与形成能预测值分别呈正相关关系和负相关关系。并且,X位元素相关的原子特征对形成能的预测具有联合影响。本工作强调了在机器学习预测材料性质的过程中,数据集的筛选与处理对提高预测结果的准确性具有重要作用。同时,Shapley模型在发现材料性能影响机制,补充和证明材料领域现有的知识体系等方向具有很好的发展前景。