分类性能相关论文
收集了200个抗癌药和10 940个非抗癌药,采用加权和欠采样方法,获得了均衡数据集。为了从众多结构指纹或者描述符找出简短且对抗癌药......
本文织物疵点特征提取算法将灰度共生矩阵和Gabor滤波嚣相结合,利用Gabor滤波器能捕获纹理较多的有用信息和准确度高的优势,辅以灰......
为有效提高模糊认知图(Fuzzy Cognitive Map,FCM)的分类识别性能,同时保留其对情感的认知能力,该文提出了融合FCM方法.为实现决策......
为解决传统的支持向量域数据描述(SVDD)方法在分类信息较少的情况下分类不准确的问题,提出一种基于半监督学习的加权支持向量域数......
系统地讨论了超曲面神经网络在多维特征空间中实现模式分类的行为.与传统的超平面神经网络(BP网络),超球面神经网络(RBF网络)相比,......
本文提出了一种基于模式树的挖掘eEPs的新算法eEPMiner,实验表明eEPMiner具有很好的性能,其速度比基于边界的算法快得多。eEPs具有......
会议
分类是数据挖掘和知识发现的重要任务之一,非均衡数据是分类中的常见问题。真实世界的分类问题存在很多类别非均衡的情况,非均衡数据......
本文在已有扩充粗糙集模型的基础上,基于集对分析中集对联系度的概念提出了一种改进的对象之间的分类关系,称之为广义集对相似关系......
高光谱图像包含密集的光谱波段,在光谱维度达到了纳米级的分辨率,提供更加丰富的光谱信息,这使其在农业、军事、环境监测等方面有......
高光谱遥感影像通常由几十到数百个光谱波段组成,这些光谱波段的反射比值一起组成了每个像元的光谱曲线。相同类型的像元一般具有相......
非负矩阵分解(NMF)算法通过矩阵分解操作,可以对高维空间的数据矩阵进行处理,以达到消除噪声、压缩数据的目的.为解决多标记学习框......
属性约简是粗糙集核心内容之一,然而,传统基于邻域粗糙集的局部约简算法具有以下两个问题:1)经典邻域粗糙集没有关注到半径变化对......
企业内部的专家检索是人们通常遇到的一个问题,通常人们使用企业中网页数据作为数据源进行分析查找.本文工作中我们考虑完全使用企......
网络应用爆发式增长,网络流量急速膨胀,大量涌现的新型应用比传统应用具有更复杂的结构和流量模式基于流量识别技术,能够细粒度的管理......
支持向量机在处理非线性问题时,具有良好的分类检测能力,可以解决OFDM-CDMA系统多用户检测问题。由于支持向量机的惩罚参数和核函数......
目前广泛使用的语音识别算法包括矢量量化(Vector Quantization, VQ),高斯混合模型(Gaussian Mixture Model, GMM),隐马尔可夫模型......
脱机手写体汉字识别是一种实现中文信息的自动化录入技术,它的研究不仅具有很高的理论价值,更有着广泛的实用价值。由于汉字类别多、......
极限学习机作为一种前馈神经网络的新型学习算法,它有比较简单的结构、较少的参数调整,以及较低的计算复杂度等优点,并且已经取得了国......
随着移动终端技术以及社交媒体技术的飞速发展,每天都有海量的多媒体内容出现在社交媒体上,其中最典型的就是图像、视频,用户往往......
随着互联网技术的发展,网上文档资源的日益增加,面对海量的信息,人们很难迅速准确的找到真正需要的资源。如何对浩如烟海的文献、......
在模式识别和计算机视觉领域中,人脸识别是一个被广泛研究的前沿课题。由于其具有隐蔽性、非现场操作性、便于理解等优点,使人脸识别......
随着移动互联网,物联网,社交网络的潮流席卷全球,全球范围内产生的数据量迅猛增长,显然我们已步入大数据时代,同时数据类型已涵盖......
科技发展带来数据维度的不断升高,对知识发现提出了更高的要求和挑战。从海量数据中发掘有意义的信息是数据挖掘研究的重点,也是各......
文本分类是处理和组织大量文本数据的关键技术。在文本分类中,特征空间的维数高达几万,导致样本统计特性的评估变得十分困难,甚至......
视觉跟踪技术作为计算机视觉领域一个重要的研究方向,是更高层次的动作识别、事件监测和视频分析等的基础,在民用和军事等许多领域得......
癌细胞识别是近来数字图像处理和模式识别领域里的一个研究热点,细胞的特征提取以及基于特征的细胞分类是癌细胞识别的关键环节之......
基于支持向量机的图像检索,是一个有望用较少的图像样本,取得较好的检索效果的检索手段。借助支持向量机强大的学习能力,研究低层视觉......
随着计算机处理能力的提高以及统计机器学习等理论的发展,浅层语义分析逐渐被研究人员所重视。语义角色标注是浅层语义分析的一种......
文本自动分类是信息检索与数据挖掘领域的研究热点与核心技术,但是在实际应用中,经常会出现文本实例中一些类中的文本很多,而另一......
随着WWW的迅速发展,网络上出现了越来越多包含着巨大利用价值的评价文本,如何自动处理这些主观文本显得愈发重要。情感分析正是在......
互联网时代的来临,使得各种电子文本数据急速增加,如何快速、有效的使用与管理这些数据,已经成为信息系统学科迫切需要解决的问题......
随着视频监控的普及和图像数据的海量增长,图像的人工检索与分类已经无法适应需求,这促进了图像分类技术的产生与发展。图像分类的......
决策树剪枝是决策树优化的常用方法。在保持决策树分类精度的前提下,该方法通过去掉决策树中某些子树的方法,达到减小决策树规模的......
支持向量机是一种机器学习方法,它以统计学理论为基础,在解决小样本非线性问题上表现出了特有的优势,自提出以来,一直受到重视。目......
最近,机器学习领域出现了一系列基于多层神经网络架构的学习方法,称为深度学习方法。深度置信网络作为经典的深度学习方法,可以包......
互联网技术的飞速发展,将我们带入了数字化、网络化的信息时代。在海量信息中,如何能快速并有效的提取有用信息成为人们研究的重要领......
近年来,在现实生活和科学研究中产生大量的高维海量数据集,使得传统分类器面临着前所未有的挑战。而大量研究表明,特征选择通过剔除不......
稀有类分类问题是数据挖掘与机器学习的一项难点任务,在典型的二元分类问题中,稀有类(或正类)的样本数远小于多数类(或负类)的样本......
本文研究了基桩超声波透射法检测的数据处理,针对目前基桩超声检测中存在的对缺陷类型鉴定模糊的问题,提出了一种基于小波分析和支持......
以北方某供水水库为例,将人工免疫识别系统(Artificial immune recognition system,AIRS)作为一种新兴数据挖掘方法用于水库调度规......
针对传统AdaBoost算法的基分类器线性组合效率低以及过适应的问题,提出了一种基于基分类器系数与多样性的改进算法——WD AdaBoost......
目的提升心电图心律失常分类算法的性能,为临床心电诊断提供辅助依据。方法将一维心电图数据按照R点进行切分,将切分后的数据生成2D......
稀疏表示是一种基于过完备字典的稀疏编码技术.在当前大数据时代下,高维数据的稀疏表示因为具有良好的数学基础,并且不需要学习与......
蛋白质和RNA相互作用对于细胞功能的行使具有重要意义。蛋白质和RNA的相互作用在许多关键的细胞生命过程中,如细胞运动、物质转运......
分类是数据挖掘领域研究的重点内容之一。分类挖掘的主要目标是在已知类别的样本集中训练出一个具有较强泛化能力的模型,以便对新......