一种用于大规模数据集的决策树采样策略

来源 :微型机与应用 | 被引量 : 0次 | 上传用户:jiangyang0266
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为提高大规模数据集生成树的准确率,提出一种预生成一棵基于这个数据集的决策树,采用广度优先遍历将其划分为满足预定义的限制的数据集,再对各数据集按照一定比例进行随机采样,最后将采样结果整合为目标数据集的数据采样方法。通过对一UCI数据集进行采样,并用现有决策树算法实验证明,该采样方法优于传统随机采样方法,基于该采样方法的生成树准确率有所提高。
其他文献
在人一人客服交互过程中,客户经常遇到响应时间延迟、处理办法不一致及反映通道单一等问题。由此,提出人一系统客服交互机制,即称为交互式客户服务代理(ICSA)的多通道应用系统,它使
随着农业信息化的推进,我国农业信息平台进入一个统筹规划、整合创新、以服务效果为导向的新阶段。探讨了云环境下农业信息门户平台建设技术,基于云计算技术建立统一的云资源中
针对电子政务中异构应用系统之间的业务协同问题,设计并实现了异构应用系统业务协同工作流服务平台原型系统。该系统可根据不同部门业务协同的需求,使用可视化建模工具,按照流程
高校校园3G网络建设已经成为各运行商争夺的焦点。通过合路技术进行多系统的室内覆盖、通过双SSID实现运行商WLAN与无线校园网集成,实现了3G与校园网的有机整合。实践表明,该
CUDA和OpenGL互操作的基本方式是使用CUDA生成数据,再利用OpenGL在屏幕上绘制出数据所表示的图形。两者的结合可以通过使用OpenGL的PBO(像素缓冲区对象)或VBO(顶点缓冲区对象1两
开发了一个VS2008环境下,基于WPF平台的交互式绘图系统。该系统利用计算机图形学的基本原理、图论知识和Windows表现层基础类库,实现了基本图形元素的绘制、编辑与修改,以及图形文件的打开、保存、打印等操作,并提供了自定义的图形数据文件格式与DXF格式相互转换的功能。
移动通信GPRS与无线网络通信ZigBee相结合,实现了智能家居安防设备的远程控制与监控。系统选用GPRS数传模块DL6200和满足ZigBee协议的CC2430模块。可通过GSM手机发送短信命令