基于数据学习的动态抽样方式设计

来源 :统计与决策 | 被引量 : 0次 | 上传用户:xfjs08jx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
动态抽样在缩减数据规模、提高数据分析效率方面表现优异,传统的动态抽样方法在设计抽样方案时,很少同时考虑总体的数据特征和后续数据分析的需要,抽样方式单一,难以满足复杂数据分析的需求.鉴于此,文章设计了基于数据学习的三种动态抽样方式,将动态抽样看成是学习总体某方面数据特征的过程,当样本的相关特征测度达到一定精度时,抽样过程结束.实验结果表明:对同一个总体而言,不同的数据分析任务需要从总体中提取不同的数据特征,从而需要选取不同的动态抽样策略,不同抽样策略获得的样本,其数据特征差异巨大;基于数据学习的动态抽样方法在保证抽样精度的前提下,缩减数据规模明显.
其他文献
在贝叶斯统计中,如果没有足够的模型信息构造似然函数,可以利用广义矩估计方法构造拟似然用于相关问题的推断.然而,这一方法在实际应用中经常由于数据含有测量误差而不能直接
文章引入虚拟变量,将带交互作用的双因素方差分析进行了线性回归模型重构,给出了模型的参数估计,证明了回归分析的误差分解与方差分析的离差分解是一致的,得出方差分析的因素
文章首先分析了服务产业的发展逻辑,包括其产业化前提、内在动因、演进特征等.然后研究了现代服务业分类的基础问题,包括对现代服务业的界定、分类要求、分类思想等,提出了应
<正> 单倍体育种是一种多快好省的育种方法,它能够控制杂种分离,加快育种速度,简化选育程序,提高选择效率,是六十年代国际上兴起的一项新的技术。我国贫下中农和科学工作者遵