关于马田系统若干问题的研究——以医疗数据为例

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:wj781228
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
马田系统(Mahalanobis-Taguchi System,MTS)是由日本著名质量工程学家田口玄一博士首先提出的一种新的模式识别方法,它以基于马氏距离(Mahalanobis Distance,MD)的信噪比(Signal to Noise Ratio,RSN)为优化指标,应用二水平正交表进行有效特征的选择,通过样品的马氏距离达到数据分类与判别分析的目的。目前,国际上马田系统的应用领域已经非常广泛,创造了巨大的经济效益和社会效益。但是,在我国,关于马田系统的理论与应用研究才刚刚起步,研究基础还相当薄弱。 本论文的研究思路为:首先,系统回顾马田系统理论和应用的国内外最新进展和研究;其次,在对马田系统进行深入分析的基础之上,通过对距离统计量与相似系数统计量的整合,构造一个新的类别可分性指标,使之既能反映样品之间的距离贴近程度,同时又能反映样品之间的形状相似程度;第三,通过计算每个特征变量的熵值,Ⅰ类分析特征变量的有效性,并通过模糊聚类的分析方法,对特征变量进行模糊聚类分析,使得相似的特征变量归为一类,从而达到识别Ⅱ类特征变量的目的;第四,根据分类类型的不同(有序分割类型与一般分割类型),分别通过3σ准则与扰动模糊分析方法,将两类判别的状况发展至多类判别,给出一般意义上的多类判别准则;最后,运用马田系统进行疾病诊断的研究,运用理论指导实践,并为我国的疾病诊断提供新的技术和方法。 本论文主要研究内容及结论有: 1)距离统计量的比较研究 经典马田系统中,类别可分性指标采用的是马氏距离统计量。从理论上讲,相比较其他距离测度,马氏距离有着比较科学的内涵:考虑到相关性、量纲的影响以及线性变换不变性等。试验也表明,马氏距离具有更好的判别效果。 2)类别可分性指标的拓展研究 在经典的马田系统中,所用类别可分性指标为距离统计量。应用距离统计量作为类别可分性指标,虽然能够有效地识别出样本之间的距离贴近程度,但却不能准确地衡量样本之间的形状相似程度。在某些识别场合下,样本之间的形状相似较之距离贴近显得更为重要。因此,本论文对经典马田系统的类别可分性指标进行拓展,整合了距离统计量与相似系数统计量,构建了样本近似度统计量,使之既能够体现样本之间的距离贴近程度,也能够衡量样本之间的形状相似程度。 3)特征变量选择方法的研究 经典马田系统采用正交表与信噪比的方法来判定特征变量有效性。这种方法不仅计算繁杂,而且随着特征变量的增多,计算量也随之成倍增大。本论文根据田口玄一的基于数据分析的思想,讨论了熵值法在特征变量优化选择问题中的应用,阐明了应用熵值法进行特征变量选择的基本原理与计算过程,并通过实际的应用算例表明熵值法的有效性。 利用二水平正交表法与熵值原理法能够剔出掉那些对识别效果起负作用或者基本不起作用的特征变量(Ⅰ类特征变量),但是却难以识别出那些对最终识别效果起相似作用的特征变量(Ⅱ类特征变量)。笔者通过模糊聚类的分析方法,对特征变量进行模糊聚类分析,使得相似的特征变量归为一类,从而达到识别Ⅱ类特征变量的目的。 4)马田系统多类判别研究 经典马田系统中,由于基准空间是由一类正常总体所定义,因而对于判别待检样品正常与否的两类判别情形具有良好的效果。然而,对于多类判别的情形,经典的马田系统方法则不能很好的解决此类问题。本论文依据分类两种类型(有序分割类型与一般类型),分别采用3σ准则与扰动模糊的分析方法,对多类判别进行了研究,并阐明了进行多类判别的原理与计算过程。 5)马田系统在医疗诊断中的应用研究 马田系统是基于数据分析的方法而不是基于变量概率分布的方法,它具有良好的应用价值。本论文选取一类典型的、在临床诊断中具有一定难度的疾病--肺病疾病,通过一定数量的健康数据作为训练样品,构造该疾病的基准空间,并通过特征优化方法对基准空间进行优化;通过构造特征变量与疾病类型之间的扰动模糊关系,将待检样品与模糊扰动模糊关系作用,确定样品的疾病类型,达到疾病诊断的目的。
其他文献
大规模定制作为一种新的生产模式,结合了大规模生产与定制生产的优势。大规模定制的有效实施,需要供应链上的企业比以往更加地协同合作,以更好地满足顾客的要求和期望,从而在激烈
耐用品在现实生活中普遍存在,而其互补品也飞速膨胀,互补品又在很大程度上影响着耐用品。这种情况下,仅考虑单个厂商的市场策略越来越显示出明显的局限性。耐用品厂商如何制定合理的市场策略,使得生产厂商之间有良性竞争,与相应互补品厂商又有互动,同时获得较高的利润,达到“多赢”就是值得研究的一个问题。本论文研究的是在研究垄断环境下,厂商经营管理中,存在互补品情况下,可以运用博弈的思想,综合互补品、耐用品的概念
当前,民营科技企业的发展面临着空前良好的机遇和环境,如何抓住机遇进行“二次创业”,实现民营科技企业的跨越式发展,赶超国内先进地区的发展水平,既是关乎河北省民营科技企业自身
公用事业涉及电力、管道煤气、电信、供水、环境卫生设施和排污系统、固体废弃物的收集和处理系统等与市民基本生活息息相关的多个行业,直接关系到城市居民生活质量和城市总体
经过二十多年的发展,信息技术外包已是世界范围内外包潮流的重要组成部分,越来越多的企业根据战略需要来运用信息技术外包。研究指出IT外包过程中客户与供应商构建适当的合作关
在中央提出“走自主创新道路,建设创新型国家”战略的背景下,作为区域经济增长中的主要力量,都市圈创新体系的建设显得尤为重要。而长三角都市圈作为我国最为发达的都市圈,近