基于可变网格划分的密度偏差抽样算法

来源 :计算机应用 | 被引量 : 12次 | 上传用户：whtdongwht

【摘要】

：

简单随机抽样是在分析处理大规模数据集时最常用的数据约简方法,但该方法在处理内部分布不均匀的数据集时容易造成类的丢失。基于固定网格划分的密度偏差抽样算法虽能有效解决该问题,但其速度及效果易受网格划分粒度影响。为此提出了基于可变网格划分的密度偏差抽样算法,根据原始数据集每一维的分布特征确定该维相应的划分粒度,进而构建与原始数据集分布特征一致的网格空间。实验结果表明,在可变网格划分的基础上进行密度偏差抽

【作者】

：

盛开元钱雪忠吴秦

【机构】

：

江南大学物联网工程学院

【出处】

：

计算机应用

【发表日期】

：

2013年09期

【关键词】

：

密度偏差抽样可变网格划分数据挖掘大规模数据集聚类 density biased sampling variable grid division da

【基金项目】

：

国家自然科学基金资助项目（61103129,61202312）,江苏省科技支撑计划项目（BE2009009）.

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

基于clustering算法的事务抽样关联规则挖掘算法

关联规则挖掘典型算法Apriori由于在频繁项集的生成时,需要多次扫描数据库,空间和时间耗费较大。之后虽然有很多Apriori算法的改进版本,但大多是从数据存储结构的角度,少有研

期刊

聚类算法事务子集关联规则挖掘APRIORI算法clustering algorithm transaction subset association

立体目标的宽基线图像匹配

为了匹配立体目标的图像特征,提出一种仿射不变的局部特征提取算法。根据高斯滤波器的形状和大小要与图像结构相适应的原理,该算法利用图像中的最大稳定极值区域(MSER)的协方差矩阵衡量局部图像结构,并将局部图像结构变换到圆形高斯滤波器适用的形式下,以解决视角和尺度变化问题。为了保证图像变换的正确性,采用旋转压缩的方式将各向异性的图像结构变换为各向同性的图像结构。最后在各向同性的图像结构上提取尺度不变特征

期刊

立体目标图像匹配宽基线仿射不变局部特征提取各向异性3D object image matching wide baseline affine in

SNAKE（2）分组密码的积分攻击

针对目前对SNAKE算法的安全性分析主要是插值攻击及不可能差分攻击,评估了SNAKE(2)算法对积分攻击的抵抗能力。利用高阶积分的思想,构造了一个8轮区分器,利用该区分器,对SNAKE(2)算法进行了9轮、10轮积分攻击。攻击结果表明,SNAKE(2)算法对10轮积分攻击是不免疫的。

期刊

分组密码SNAKE(2)积分攻击攻击复杂度block cipher SNAKE（2） integral attack attack complex

对两个无线传感器网络中匿名身份认证协议的安全性分析

针对设计安全高效的无线传感器网络环境下匿名认证协议的问题,基于广泛接受的攻击者能力假设,采用基于场景的攻击技术,对新近提出的两个无线传感器网络环境下的双因子匿名身

期刊

身份认证双因子协议匿名性离线口令猜测攻击用户仿冒攻击identity authentication two-factor protocol ano

基于果蝇优化算法的小波域数字水印算法

为了平衡水印的透明性和鲁棒性,提出了基于果蝇优化算法(FOA)的小波域数字水印算法。该算法利用果蝇优化算法将离散小波变换(DWT)应用到水印技术中,通过群体智能算法解决水印的透明性和鲁棒性之间的矛盾。为了保护数字图像的版权信息,将所选择的原始图像通过二维离散小波变换分解,然后将经过Arnold变换后的水印图像较优地嵌入到小波的垂直子带系数中,这样可以保证图像的质量。在优化过程中,缩放因子是通过FO

期刊

果蝇优化算法离散小波变换缩放因子ARNOLD变换透明性鲁棒性Fruit Fly Optimization Algorithm （FOA） Disc

基于可变网格划分的密度偏差抽样算法

其他学术论文