面向组合投资预测的大数据生成算法研究

来源 :北方工业大学 | 被引量 : 1次 | 上传用户:lovepengchen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据是近年来人们耳熟能详的词汇之一,政府部门利用大数据解决公共突发事件带来的资源调度和管理问题,工业界利用大数据技术提升产品的竞争力,金融业利用大数据预测金融市场的变化规律。林林总总,当今人们可谓进入了大数据时代。然而研究人员在研究大数据及其处理方法时,都会遇到一个不可回避的问题,即到哪里去获取大数据样本。由于大数据往往带有行业机密,不易公开等因素,使得获取所需大数据更为困难,所以生成仿真大数据集成为IT领域一个有价值的研究课题。本文针对组合投资预测应用问题,研究一种基于趋势预测的大数据生成方法,其中包括:(1)改进的时间序列预测生成算法研究。文中将介绍一种对于多维时间序列数据集的预测生成算法。(2)贝叶斯网络模型更新算法研究。把时间序列趋势预测数据模拟为随时间推移新产生的数据,使历史数据训练的贝叶斯网络模型随着新数据集的加入进行更新操作。(3)贝叶斯网络节点序列的搜索算法研究。搜索满足趋势发展要求的数据节点序列及其联合概率,并把节点序列集和概率作为大数据生成的基础数据集。(4)基于趋势预测的大数据随机生成算法研究。基于基础数据集,采用权重随机方法生成定制体量的大数据集。实验结果表明,与传统数据生成技术相比,本文提出的大数据生成方法所生成的大数据集可在保证数量的同时,也保证了原有数据相关性、时序性等特征。生成的数据具有较高的质量,具有用于组合投资预测研究的价值。
其他文献
心脏疾病多属于慢性病。慢性心血管疾病具有发病率高、致残率高和死亡率高等特点。其中,心律失常是一种较为常见的心血管疾病类型。大部分心血管疾病往往伴随着心律失常出现
肝细胞癌约占原发性肝癌的90%,易发生转移和复发,是第二大与癌症相关的主要死因。肝细胞癌的复发与其分化等级密切相关,术前确定分化等级对选择治疗策略至关重要。当前,病理
目的:评价冠状动脉树及病变评估(Coronary Artery Tree description and Lesion EvaluaTion,CatLet)冠脉评分系统在不同观察者间和同一观察者自身的一致性。背景:课题组自主
对于资源型城市,该类城市的发展与当地资源型产业的发展密切相关,就资源型城市的发展历程来看,多数都为由最开始的兴起,到繁荣,最终逐渐衰退,这个历程也被众多学者认为是资源
本文以Cu-Zr非晶合金为研究对象,运用层次聚类法挖掘出非晶合金的短程序团簇结构,建立非晶合金短程序结构的新范式。通过对团簇结构的数据分析,判断不同非晶合金的玻璃形成能
在创新型产品的供应链当中,期权契约被广泛的采用。然而,越来越多的中小企业面临着资金约束的难题,本文研究的主要对象便是在执行期权时面临资金约束的零售商。为了研究零售
推荐系统是各类电子商务网站采取的一个提高网站各类信息浏览量的措施,它向客户提供商品信息和建议,帮助用户找到其可能感兴趣的产品,模拟销售人员帮助客户完成购买过程。其
当前,随着科技水平的进步与拍摄手段的更新,遥感卫星图像的数量与质量有着极大的提升,所包含信息也越来越多,如何充分利用遥感图像进行环境、农业、城市发展等方向的研究,是
新中国成立初期,毛泽东开启了中国工业化和城乡发展道路的探索,形成了具有中国特色的城乡关系思想,回答了如何把中国从一个落后的农业国变为一个先进的工业国的时代之问,成为
信息的高速发展与互联网行业的不断进步,使各行各行都加剧了信息服务的压力,图书馆领域亦是如此,参考咨询是图书馆的核心工作之—,在数字化大环境下,参考咨询突破了空间区域,