几种分类问题的研究

来源 :吉林大学 | 被引量 : 0次 | 上传用户:yu555497
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文着重部分常用线性回归方法与非线性方法关于分类问题的比较。关于线性方法,主要探讨普通线性回归模型的最小二乘法(OLS:ordinary least squares),线性判别分析(LDA:linear discriminant analysis)与logistic回归的效果的比较,同时尝试PCA与FDA两种降维方法,并将OLS与LDA结合降维后的数据进行分类效果的比较分析。OLS是最基本的线性模型,除了处理回归问题,也可以处理分类问题,只是此时的因变量不再是单一向量,而是变成了指示矩阵,即行表示观测,列表示分类,每行只在其所归属分类下为1,其余位置为0。对于线性分类问题,OLS一般都会有比较好的分类效率,然而当类别之间平行排布的话,OLS时常会忽视其中的某一分类,这是其非常严重的劣势所在。LDA与OLS一样对线性边界有很好的分类效率,并且避免了OLS关于平行类别的忽视问题,一般来讲较OLS的分类效率高一些。Logistic回归最初就是用来处0-1两个类别作为因变量的模型,其运用概率比的方式将本来只有两个取值的类别因变量变成在0-1之间的连续数值型变量,很好地解决了分类问题,此处将其拓展为对多于两个类别的分类问题的探索;由于其模型的特点,对分类问题常常都有很好的分类效率。关于非线性方法,主要探讨SVM(support vector machine), Tree,Bagging(Bootstrap aggregating),随机森林的效率。SVM通过对参数的调整使得其对于各种线型,高阶曲线型乃至放射型边界都有很好的适应性,是通用性很强的分类方法。单一决策树由于其将数据分块处理的机制,使得其对线性边界的分类问题产生很高的错误率,并且饱受高方差低准确率的困扰。Bagging通过随机产生大量决策树并将它们的判别结果“取”均值的办法基本消除了单一决策树的高方差低准确率的缺点。随机森林则进一步通过强制选择随机选择变量的方法弥补了当某一变量在该分类问题起主导作用时候Bagging无法消除相关决策树的高方差的不足。最后本文选取“单个字母识别”数据,采用以上方法构建分类模型并比较。
其他文献
研究背景及目的:肝癌是我国最常见的恶性肿瘤之一,可分为原发性肝癌和继发性肝癌两大类。原发性肝癌即为发生于肝细胞或肝内胆管上皮细胞的恶性肿瘤,90%的原发性肝癌为肝细胞癌(Hepatocellular carcinoma),而90%的肝细胞癌患者有乙肝病毒(HBV)或丙肝病毒(HCV)感染史。绝大部分肝癌病人最终的死亡原因为肝癌转移。肝癌转移过程中涉及大量基因的表达异常以及相关信号通路的异常。因此,
近年来科学家们越来越关心的一个重要问题是物质微观结构的构成,研究物质的微观结构一种特殊的方法是利用巨大的显微镜一加速器,将粒子束流加速并对撞。高能重离子碰撞实验可
近年来复杂网络在各行各业得到广泛的应用,复杂网络科学理论也为蓬勃发展的网络科技,网络工程设计、防护和开发应用等提供坚实的理论与技术基础,所以复杂网络的理论研究依然
偏微分方程作为数学的一个重要分支,在现代科学技术中具有重要的实际应用背景和理论价值.生物学、物理学、化学、经济学以及工程学的许多问题是通过建立数学模型,进而应用反
本文主要利用广义最大值原理、不动点指标理论及分歧理论研究一类具有外加毒素的单营养双竞争物的非均匀恒化器模型:St=dSxx-auf1(S)-bvf2(S), x∈(0,1),t>0, ut=duxx+auf1(S)
MV-代数是研究逻辑代数的重要理论基础.本文给出了MV-代数中一种距离函数的定义,并且讨论了它的性质;其次,在MV-代数中引入了“e”运算,从而对MV-代数上定义的距离函数作了进
本文主要研究了无限维Banach空间上标准算子代数之间双边保左(或右)因子和因子的可加满射以及无限维复Hilbert空间上全体有界线性算子代数之间双边保左(或右)*因子的可加满射
稀土掺杂12Ca O·7Al2O3上转换发光材料在光、电等材料领域具有广泛的应用。本文主要通过高温固相法制备Eu3+、Yb3+、Tm3+掺杂的12Ca O·7Al2O3多晶,研究制备工艺及上转换发
逆谱Sturm-Liouville问题一直是应用数学研究的一个重要课题,它在地球物理学,量子力学等领域有着广泛而直接的应用.本文研究两类Sturm-Liouville算子问题的谱及逆谱问题,其中
本文从算子代数和量子力学的关系入手,运用算子谱论和迹的循环性质等方法,研究Schrodinger不确定性关系的一些推广形式,得到了由广义Wigner-Yanase斜信息建立的不确定性关系,