论文部分内容阅读
K-最近邻(K—nearest neighbor,简称KNN)算法是一种在人工智能领域如专家系统、数据挖掘、模式识别等方面广泛应用的算法。该算法简单有效,易于实现,但是其K值难以确定,而且分类结果易受单个属性干扰。文中提出了一种简单易行的K值确定方法,并利用Quinlan信息增益理论,提出了基于信息增益的K-最近邻改进算法。通过实验证明,改进后的K—NN算法具有较强的抗干扰能力和较好的精确性。