论文部分内容阅读
数据挖掘技术从提出到现在短短二十多年里,吸引了众多专家和学者的广泛研究,并在金融业、电信业、零售业、制造业、医疗保健等领域发挥了巨大作用。证券业作为我国较早应用信息技术的行业,已经建立了较完善的事务处理系统。多年证券市场的发展,也使得证券行业积累了大量的数据,其中隐含着大量有价值的信息。如何利用这些数据,深层次地挖掘信息,为证券投资的决策服务,已成为证券行业研究的当务之急。由于数据挖掘技术处理海量数据的能力,以及其建立模型的智能性特征对证券分析具有重大的意义。本文研究数据挖掘技术在股票投资中的应用,主要工作如下:本文从数据挖掘算法介绍入手,主要介绍了数据挖掘技术,特别是神经网络技术和聚类分析技术的原理和应用。之后,为解决股民的入市时机选择问题,引入了神经网络模型,通过建立神经网络模型对次日收盘指数进行预测,在模型的构建上,不仅考虑到前一期数据对预测结果的影响,还考虑到了历史期数据可能造成的影响,建立了神经网络的一期预测模型和多期预测模型,并对上证综合指数进行分析预测。经过多次实验,以及对大量实验结果进行分析比较,得到了精度较高的次日收盘指数预测模型,利用该模型,预测了2010年1至4月份的上证综合指数次日收盘点数,通过与真实值比较发现,本文建立的神经网络模型在预测上证综合指数方面具有较好的效果。进一步地,为了解决股民个股选择问题,引入数据挖掘技术中的聚类分析算法,通过选取个股的财务相关指标,构建聚类分析指标体系,进而选取A股市场800余只股票,利用Clementine软件,进行聚类分析。在聚类模型的选择上,本文通过尝试K-means聚类、Kohonen聚类和TwoStep聚类方法后发现,TwoStep聚类方法在区分股票类别上效果更明显,因此,选取了TwoStep聚类方法将这些股票聚成比较显著的类别,从而区分出优质股票,可为股民选择个股提供了有效的决策参考。