论文部分内容阅读
心音分类可用于检出异常心音、发现心血管病患者,在心血管病诊断方面能发挥重要作用,是基于心音信号的心血管病自动诊断领域的主要研究热点,吸引了众多国内外学者的研究兴趣。传统上基于经验选择心音信号特征以执行分类任务的方法,存在有效特征获取难、分类效果欠佳等不足。随着人工智能技术的发展,近年来深度学习已成为研究心音分类的主流方法,在分类性能上取得了较大提升。基于深度学习的心音分类网络一般都基于较大的神经网络所建立,需要大量训练样本来优化其权值。但是,现实中采集大量的心音数据是困难且昂贵的,从而导致难以获取充足的心音训练样本。因此,心音分类面临着小样本问题的挑战,且目前缺乏有效的解决方法。本文针对小样本心音分类,主要做了以下工作:
(1)提出了基于监督阈值的心音分类方法,解决了当前基于原始心音样本分割的训练数据扩增方式所导致的原始心音样本标签估计问题。在主流的基于深度学习网络的心音分类方法中,先将原始心音训练样本分割为多个片段,再将每个片段用于训练分类网络,从而实现训练数据的扩增,是解决心音训练样本不足的主要手段。但这会导致一个问题,即在进行预测时,如何根据片段的预测结果来估计原始心音样本的标签。传统的片段分类概率平均法和片段预测标签投票法解决此问题的效果不佳。本文提出了基于监督阈值的心音分类方法,其关键创新点就在于设计了一种基于监督阈值的原始心音样本标签估计规则。该规则可较好的解决主流深度学习方法针对小样本分类所采用的手段存在的问题,其设计思路可推广为解决这一类问题,即如何根据样本局部的类别来估计样本类别。与基于深度学习的基线方法相比,利用基线和该规则相结合得到的基于监督阈值的心音分类方法明显改善了分类效果。
(2)建立了将数据降维过程和利用低维表示分类的过程进行直接连结的分类网络,其能实现对这两个过程的联合优化,基于该网络提出了一种新的心音分类方法。获取大量心音样本是困难的,而且其数据维数较高,因此心音分类面临着小样本高维数据分类问题。将高维数据映射到低维空间后,再利用其低维表示进行分类,是解决小样本高维数据分类问题的传统常用方法。在这类方法中,数据降维过程和利用低维表示分类的过程一般是独立进行的,即降维不受分类的约束,这容易导致含有类别属性的数据信息在降维过程中被过多地丢失,从而造成低维表示的区分性不足,为分类任务带来不利影响。为此,本文选择半非负矩阵分解进行数据降维,建立了能对数据降维过程和利用低维表示分类的过程进行联合优化的分类网络。该网络可促使数据降维沿着对分类任务有利的方向进行,使得含有类别属性的数据信息在降维过程中被较好地保留在低维表示中,从而让低维表示更具区分性。利用该网络设计了一种新的心音分类方法。与降维过程和分类过程独立进行的心音分类方法相比,新方法取得了更高的分类正确率。此外,与基于深度学习的心音分类方法相比,新方法在小样本情况下也获得了明显更好的分类表现。
(3)提出了稀疏半非负矩阵分解的数学模型,将该模型用于改进(2)中的分类网络,从而得到了将稀疏降维过程和利用稀疏低维表示分类的过程进行直接连结的新分类网络,并基于该网络提出了一种新的心音分类方法。将稀疏约束与数据降维相结合,以获得稀疏低维表示,已被证明有助于让低维表示更具区分性,从而获得更好的分类效果。在这类方法中,控制低维表示稀疏度的参数一般需预先指定,且通常采用枚举法来搜索合适的稀疏参数。但是枚举方式是非常耗时的,且最终搜索出的稀疏参数也不一定最优。为此,我们提出了稀疏半非负矩阵分解的数学模型,推导了基于乘法规则的分解因子迭代更新公式,并且将该模型用于稀疏降维,建立了将稀疏降维过程和利用稀疏低维表示分类的过程进行直接连结的新分类网络。在该网络中,稀疏半非负矩阵分解中的稀疏参数是网络权值,可通过学习来优化,因此,其实现了对分解因子的自适应稀疏。将该网络用于心音分类,进一步提升了分类效果,更好的解决了小样本心音分类问题。
概括来说,本文针对小样本心音分类问题,首先研究了主流深度学习方法解决此问题所用的手段存在的欠缺,提出了基于监督阈值的心音分类方法,显著改善了深度学习方法的分类效果。然后设计了两种能较好地解决小样本高维数据分类问题的分类网络,基于这两种网络,分别提出了新的心音分类方法。在小样本情况下,与近年来的优秀方法相比,新方法均获得了更好的心音分类效果。最后,对论文内容和创新点作了总结,指出了几个可进一步研究的问题或方向。
(1)提出了基于监督阈值的心音分类方法,解决了当前基于原始心音样本分割的训练数据扩增方式所导致的原始心音样本标签估计问题。在主流的基于深度学习网络的心音分类方法中,先将原始心音训练样本分割为多个片段,再将每个片段用于训练分类网络,从而实现训练数据的扩增,是解决心音训练样本不足的主要手段。但这会导致一个问题,即在进行预测时,如何根据片段的预测结果来估计原始心音样本的标签。传统的片段分类概率平均法和片段预测标签投票法解决此问题的效果不佳。本文提出了基于监督阈值的心音分类方法,其关键创新点就在于设计了一种基于监督阈值的原始心音样本标签估计规则。该规则可较好的解决主流深度学习方法针对小样本分类所采用的手段存在的问题,其设计思路可推广为解决这一类问题,即如何根据样本局部的类别来估计样本类别。与基于深度学习的基线方法相比,利用基线和该规则相结合得到的基于监督阈值的心音分类方法明显改善了分类效果。
(2)建立了将数据降维过程和利用低维表示分类的过程进行直接连结的分类网络,其能实现对这两个过程的联合优化,基于该网络提出了一种新的心音分类方法。获取大量心音样本是困难的,而且其数据维数较高,因此心音分类面临着小样本高维数据分类问题。将高维数据映射到低维空间后,再利用其低维表示进行分类,是解决小样本高维数据分类问题的传统常用方法。在这类方法中,数据降维过程和利用低维表示分类的过程一般是独立进行的,即降维不受分类的约束,这容易导致含有类别属性的数据信息在降维过程中被过多地丢失,从而造成低维表示的区分性不足,为分类任务带来不利影响。为此,本文选择半非负矩阵分解进行数据降维,建立了能对数据降维过程和利用低维表示分类的过程进行联合优化的分类网络。该网络可促使数据降维沿着对分类任务有利的方向进行,使得含有类别属性的数据信息在降维过程中被较好地保留在低维表示中,从而让低维表示更具区分性。利用该网络设计了一种新的心音分类方法。与降维过程和分类过程独立进行的心音分类方法相比,新方法取得了更高的分类正确率。此外,与基于深度学习的心音分类方法相比,新方法在小样本情况下也获得了明显更好的分类表现。
(3)提出了稀疏半非负矩阵分解的数学模型,将该模型用于改进(2)中的分类网络,从而得到了将稀疏降维过程和利用稀疏低维表示分类的过程进行直接连结的新分类网络,并基于该网络提出了一种新的心音分类方法。将稀疏约束与数据降维相结合,以获得稀疏低维表示,已被证明有助于让低维表示更具区分性,从而获得更好的分类效果。在这类方法中,控制低维表示稀疏度的参数一般需预先指定,且通常采用枚举法来搜索合适的稀疏参数。但是枚举方式是非常耗时的,且最终搜索出的稀疏参数也不一定最优。为此,我们提出了稀疏半非负矩阵分解的数学模型,推导了基于乘法规则的分解因子迭代更新公式,并且将该模型用于稀疏降维,建立了将稀疏降维过程和利用稀疏低维表示分类的过程进行直接连结的新分类网络。在该网络中,稀疏半非负矩阵分解中的稀疏参数是网络权值,可通过学习来优化,因此,其实现了对分解因子的自适应稀疏。将该网络用于心音分类,进一步提升了分类效果,更好的解决了小样本心音分类问题。
概括来说,本文针对小样本心音分类问题,首先研究了主流深度学习方法解决此问题所用的手段存在的欠缺,提出了基于监督阈值的心音分类方法,显著改善了深度学习方法的分类效果。然后设计了两种能较好地解决小样本高维数据分类问题的分类网络,基于这两种网络,分别提出了新的心音分类方法。在小样本情况下,与近年来的优秀方法相比,新方法均获得了更好的心音分类效果。最后,对论文内容和创新点作了总结,指出了几个可进一步研究的问题或方向。