基于不均匀数据的密度偏差抽样改进算法

来源 :软件导刊 | 被引量 : 0次 | 上传用户:Gaosboy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对不均匀数据集的抽样问题,已有随机抽样算法、基于固定网格划分的单维度算法、基于可变网格划分的单维度算法,但仍无法更好地反映数据分布特征问题。在数据挖掘的实际应用中,数据规模越来越大,数据类型也越来越复杂,存在系统整体开销大、时间运行成本高等问题。提出并实现了基于不均匀数据的密度偏差抽样改进算法(IDDS),通过引入网格单元密度和三角函数,从而达到较好的密度偏差抽样效果。实验结果发现,IDDS算法抽样效果更好,提取的样本质量更高,有效保证了不均匀数据的分布特征。与原始的密度偏差抽样算法(DDS)相比,应用
其他文献
视网膜血管分割算法是自动视网膜疾病筛查系统主要部分。视网膜血管检测在医学诊断上应用日益广泛,对糖尿病、青光眼等病状有较精确的诊断。提出一种新的全卷积神经网络视网
形式化方法在软件开发过程中一直扮演着重要角色。由于其建立在严格的数学基础之上,因此开发成本较高。为了解决开发成本问题,将软件开发整体分为形式化开发集合类和非形式化
微博的普及导致微博平台数据量日益增长,因此从海量微博中快速准确地为微博用户推荐好友成为了巨大挑战。用户的社交网络和微博文本在一定程度上体现了用户的价值观和兴趣爱
文章分析了知识管理在企业战略决策中的作用,并结合战略决策的特点讨论了如何借助系统动力学分析方法实现基于知识的战略决策.