论文部分内容阅读
随着经济的发展,人们对于股市的关注度逐渐提高,很多人投身于股市之中。由于股市的高复杂性以及影响股市的因素较多,给股市的预测带来了难度。股市专家也一直致力于股市的研究,并提出预测性较高的模型来揭示股市的运行模式,为投资者的投资提供决策。如何有效的利用历史投资数据进行数据挖掘,为个体用户提供投资推荐是值得研究的问题。随着数据挖掘技术的不断发展,对于金融行业来说,越来越多的金融时间序列数据亟待处理。在金融资产投资上,个体用户与企业用户相比,永远处于高风险之中,目前大多数金融数据挖掘算法都面向企业,在个体用户数据挖掘和投资推荐上的研究较少。与企业相比,个体用户的金融时间序列数据有着不同的特性,不能使用传统的数据挖掘算法为其所用,本文针对个体用户的投资行为,利用改进的k-means算法为用户推荐感兴趣且上涨概率较大的股票。论文对传统线性回归模型及其参数计算进行改进,提出了PRA降维算法,将原始数据特征降低为线性回归模型的参数维度,降低了时间复杂度。通过相似性查找算法,将PRA降维后的数据特征进行相似性查找,对相似性较高的进行聚类。将相似性高的簇作为叶子节点构件核心树。过核心数据进行迭代以完善核心树的枝叶。通过k-means算法对叶子节点进行后续处理,增强了核心树的鲁棒性。在改进算法基础上,论文为个体用户实现了一个基于聚类算法的金融数据挖掘个体用户投资推荐系统。实验和测试结果表明,该系统与改进算法可以实时进行金融投资的推荐,并通过客户有效的输入相应时间段的金融时间序列数据,给出推荐的结果与每个结果的得分排名,排名越高,该股票或者金融资产的投资收益越高,大大降低了个体客户的投资风险,增加了投资收益。通过对本系统的设计与实现,希望为今后的个体用户投资推荐系统的研究奠定基础。