基于可变网格划分的密度偏差抽样算法

来源 :计算机应用 | 被引量 : 12次 | 上传用户:whtdongwht
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
简单随机抽样是在分析处理大规模数据集时最常用的数据约简方法,但该方法在处理内部分布不均匀的数据集时容易造成类的丢失。基于固定网格划分的密度偏差抽样算法虽能有效解决该问题,但其速度及效果易受网格划分粒度影响。为此提出了基于可变网格划分的密度偏差抽样算法,根据原始数据集每一维的分布特征确定该维相应的划分粒度,进而构建与原始数据集分布特征一致的网格空间。实验结果表明,在可变网格划分的基础上进行密度偏差抽样,样本质量明显提升,而且相对于基于固定网格划分的密度偏差抽样算法,抽样效率亦有所提高。
其他文献
关联规则挖掘典型算法Apriori由于在频繁项集的生成时,需要多次扫描数据库,空间和时间耗费较大。之后虽然有很多Apriori算法的改进版本,但大多是从数据存储结构的角度,少有研
为了匹配立体目标的图像特征,提出一种仿射不变的局部特征提取算法。根据高斯滤波器的形状和大小要与图像结构相适应的原理,该算法利用图像中的最大稳定极值区域(MSER)的协方差矩阵衡量局部图像结构,并将局部图像结构变换到圆形高斯滤波器适用的形式下,以解决视角和尺度变化问题。为了保证图像变换的正确性,采用旋转压缩的方式将各向异性的图像结构变换为各向同性的图像结构。最后在各向同性的图像结构上提取尺度不变特征
针对目前对SNAKE算法的安全性分析主要是插值攻击及不可能差分攻击,评估了SNAKE(2)算法对积分攻击的抵抗能力。利用高阶积分的思想,构造了一个8轮区分器,利用该区分器,对SNAKE(2)算法进行了9轮、10轮积分攻击。攻击结果表明,SNAKE(2)算法对10轮积分攻击是不免疫的。
针对设计安全高效的无线传感器网络环境下匿名认证协议的问题,基于广泛接受的攻击者能力假设,采用基于场景的攻击技术,对新近提出的两个无线传感器网络环境下的双因子匿名身
为了平衡水印的透明性和鲁棒性,提出了基于果蝇优化算法(FOA)的小波域数字水印算法。该算法利用果蝇优化算法将离散小波变换(DWT)应用到水印技术中,通过群体智能算法解决水印的透明性和鲁棒性之间的矛盾。为了保护数字图像的版权信息,将所选择的原始图像通过二维离散小波变换分解,然后将经过Arnold变换后的水印图像较优地嵌入到小波的垂直子带系数中,这样可以保证图像的质量。在优化过程中,缩放因子是通过FO