基于分块后重叠K-means聚类的KNN分类算法

来源 :工业控制计算机 | 被引量 : 0次 | 上传用户:czg
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
因为KNN最近邻算法的复杂度至少为线性,所以KNN算法在大数据环境下的计算量,以及所需要的硬件开销都面临挑战。提出一种新的KNN算法即在KNN分类前引入分块和聚类算法。具体描述为:对样本先随机进行分块,再在块上聚类,形成数目比较多的簇,但如果簇的数目过多虽然能提升计算速度,但是在分类时会影响分类的精确度,所以在很多簇的基础上再进行聚类,这样不仅速度大大提高,精确度也能提高,从而达到分类精确度的提高。最后在测试过程中找出与待测样本距离最短的块作为新的训练样本作为进行分类算法。
其他文献
计量泵广泛应用于石油、化工及水处理领域,其中计量泵流量的检测和控制尤为重要。传统流量调节方案精度差,自动化程度低,针对这一问题,提出一种数字变频控制器在DCS中的应用
在IC生产测试中,经常会采取多工位的测试,这样的测试方法会显著提高测试的效率,提高生产量。然而,此种测试也会带来重大的生产隐患,严重时会带来重大的生产事故。采取传统的
近几年来,手机、平板等移动端应用越来越广泛,其优点不断凸显。实现移动端的工业监控,成为非常具有实用价值的研究课题。该设计中,实现了以PHP语言为基础的服务器端,并设计以
车牌识别系统是智能交通管理的重要部分,而车牌字符识别是智能交通系统的核心内容,目前,传统的浅度学习神经网络BP(Back Propagation)人工神经网络因其优越的性能而广泛应用到车牌识别中,但是BP神经网络在局部极值、假饱和、收敛速度缓慢等方面存在着不足。而深度学习[1]与浅度学习相比,其网络结构更接近实际的生物神经网络,因此具有更强的能力,可以很好地提高车牌字符的识别率。其中深度学习神经网
零件正反面检测在生产活动中具有重要的意义,尤其在零件包装行业更是如此。传统的人工检测方式效率较低。提出了一种基于图像处理的环形零件正反面检测方法。该方法首先对采集到的图像进行预处理,突出其形状信息;然后对预处理后的图像进行零件长轴定位,通过移动长轴并计算长轴上下零件像素信息的变化比来判断零件的正反面。经实验表明,该方法准确度高、检测速度快。
近红外光谱定量分析技术用于汽油性质检测具有快速、高效的特点,但该方法对模型的质量要求很高,需要及时进行模型维护。提出一种汽油辛烷值模型维护的判断方法,首先采用主成
随着社会和科技的发展,智能监控系统随处可见,而运动人群是监控视频中的一个重要组成部分,但对于智能监控中人群行为的分析还处于理论分析阶段。对人群群组运动的集体性进行了详
电站燃煤锅炉是大气NOx污染的主要来源之一,建立良好的NO_x排放模型是降低锅炉NO_x的基础。为了提高对锅炉NO_x排放浓度的预测效果,提出了利用最小二乘支持向量机(Least Squar
为优化数字视频与Zynq-7000系统间高速数据流的传输质量,设计并实现了一种基于AXI4总线的数字视频采集系统。对外部输入的DVP信号RAW格式数字视频进行线性插值处理,采用AXI4协议对传输信号协议进行转换;通过Zynq-7000的HP端口将数据流存入DDR内存中,实现软硬件数据的共享;设计并实现基于AXI4总线协议的VGA显示模块,输出经过系统处理的采集图像。系统平台实现了视频采集、数据预处