广义线性模型中基于惩罚函数的变量选择应用研究

来源 :福建农林大学 | 被引量 : 1次 | 上传用户:wwwboy2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据自动采集技术的迅猛发展,大数据的概念已被广泛接受,传统的统计方法面临挑战。如在医学的基因数据分析中,样本可能只有几百人,而基因数量可能达到成千上万个,或数据中的噪声较多,掺杂着许多与响应变量无关的解释变量,因此希望实现变量选择而降维。基于惩罚函数的变量选择方法是一种处理高维数据常用的方法,分为三类:单变量选择、组变量选择和双层变量选择,本文主要研究基于惩罚函数的变量选择在不同线性模型、不同数据结构下的变量选择效果,研究分为两部分内容,具体内容如下:1、将惩罚函数的变量选择方法推广到广义线性回归模型(1)在Logistic回归模型中基于惩罚函数变量选择方法的研究。首先通过计算机模拟对六种不同类型的数据进行研究,最后以UCI中Arrhythmia数据集进行实例验证,得到在Logistic回归模型中,双层变量选择方法GB-L(Group Bridge Logistic)均表现出优良的性质--具有较高的预测精度且较为稳定地、准确地选择变量。由此得到:在Logistic模型中,应用惩罚函数变量选择方法能够提高疾病诊断的准确率,辅助医生进行疾病诊断并且预测患者的危险状态。(2)在Cox风险比例回归模型中基于惩罚函数变量选择方法的研究。首先通过计算机模拟对七种不同的数据结构进行模拟研究,最后以乳腺癌数据集为实例,设定五种不同的删失比例进行分析,得到在Cox风险比例回归模型中,基于惩罚函数的双层变量选择方法cMCP-C(Composite MCP Cox)均表现优良--对于不同类型的数据结构,只要删失比例不高,均能较其他方法更好地选择变量。2、惩罚函数的变量选择方法应用于高维复杂的基因数据分析研究--数量性状基因座(Quantitative Trait Loci,QTL)定位和全基因组关联分析(Genome Wide Association Studies,GWAS),应用实例数据进行模拟研究和实例验证,将随机森林、基于惩罚函数的单变量选择SCAD与双层变量选择cMCP进行比较,最终得到:(1)cMCP应用于QTL定位效果好,能够准确地定位到QTL;(2)在全基因组关联分析中,cMCP-L能够准确地定位到与遗传性疾病显著相关的遗传位点。综上分析,无论对于Logistic模型、Cox风险比例回归模型、QTL定位还是全基因组关联分析,基于惩罚函数的双层变量选择方法均能保持优良的性质--能够较为准确地、稳定地选择变量,且由此确定的回归模型的预测精度高。
其他文献
硅通孔技术(Through Silicon Via,TSV)是通过在芯片和芯片之间、晶圆和晶圆之间制作垂直导通,实现芯片之间互连的最新技术。该技术能够使芯片在三维方向的堆叠密度最大,外形
随着硬件设备和智能显卡的发展,人工智能技术近些年有了长足的进步,同时在体育行业中的应用也逐渐增多。本课题以当下体育行业热门研究方向——冰壶运动为研究背景,结合人工
在市场竞争日益激烈的今天,作为高耗能的水泥行业也在不断寻求安全稳定运行、提高单位时间产量、节能降耗的方式,寻求在保证质量前提下,最大限度的降低单位成本以及运维成本,
会议
多目标优化潮流(Multi-objective Optimal Power Flow,MOOPF)是实现电网优化运行的主要手段,它能够在零约束违反的情况下提高经济性和稳定性。非凸、非线性和高维特性使得传
近年来,随着中国铁路的飞速发展,铁路隧道信息化、数字化、智能化建设越来越受到重视,“智慧隧道”的建设理念被逐步推广开来,这对于铁路隧道进行高效监测管理、列车安全运行以及施工人员安全作业等具有重要意义。在科学技术高度发达的今天,利用现代化信息网络技术组建高效率的铁路隧道环境监测网络,对于提升铁路隧道信息化管理程度、保障列车安全运行、提升隧道施工维护作业效率等具有重大现实意义。无线传感网络(Wirel
瞬态电子器件具有在到达预定的使用时间或者在外界条件可控触发下完全失效甚至降解的特性。硅是现代电子工业中应用最为广泛的半导体材料,但是其良好的化学稳定性制约了硅作
机组组合优化问题研究在电力系统经济调度中占据重要的地位。合理的开停机组合与负荷分配不仅可以延长机组的运行寿命,还可以提高电厂的发电效益。UC问题的研究已经取得丰富的研究成果,但相邻日影响相关研究比较薄弱。本文针对机组组合优化问题进行研究,主要工作内容如下:首先,阐述经典机组组合优化问题的数学模型。论证相邻日影响在火电机组的存在性,并且说明今日计划对次日计划产生的影响。目前大部分模型考虑到昨日影响,
目的:通过蛞蝓抗大鼠支气管哮喘作用和对小鼠止咳化痰作用研究,探讨其抗支气管哮喘作用机制,筛选蛞蝓止咳化痰活性成分。建立以活性成分为指标的含量测定方法,为蛞蝓质量控制体系的建立及蛞蝓药材的综合利用提供实验依据。方法:1.将40只SD大鼠随机分为6组,每组8只,分别为正常组、模型组、地塞米松组、蛞蝓高剂量组、蛞蝓低剂量组。除正常组外,其余各组于实验第1、8天腹腔注射10%OVA溶液1mL,第8天追加臀
下一代新型处理器,即类脑计算芯片,需要像人类大脑一样具备高并行处理能力、高容错率和高存储密度的能力,以满足人工智能的发展需求。采用新材料、新器件模拟神经突触、神经
玻璃基板作为液晶平板显示产业的关键基础元器件,被广泛的应用在各种相关产品的生产制造中,成为人们日常生活中不可或缺的一部分。用于平板液晶显示器的玻璃基板在生产制造中