论文部分内容阅读
中国金融市场在最近30年取得了令世界瞩目的成绩,随着互联网技术发展以及服务不断完善,各金融机构都累计了海量的交易和资讯类型的数据,如何将这些数据综合利用起来,以便于更好的回馈于金融市场是各金融企业亟待解决的问题。在传统经济学领域,通常采用各种经济学指标对市场的行为和现象进行研究与分析解释。随着复杂系统理论不断发展,复杂网络研究取得了大量丰富的成果。金融市场作为一个典型的复杂系统,将复杂网络的研究成果应用于金融市场,具有非常重要的理论和现实意义。尤其在国家大力推动金融科技战略的背景下,通过复杂网络的分析方法来研究金融数据,已经成为了工业界和学术界共同追捧的热点。金融股权网络作为金融市场重要的组成部分,弥补了传统金融网络研究对股权投资信息的重视不足,从而更加客观的刻画了金融市场的复杂特征。金融股权网络涵盖股票以及信托、基金、期货等金融衍生产品,股权结构十分复杂。传统复杂网络技术在处理时,通常采用自定义的网络特征进行分析,然而这种手动提取的数据特征粒度较粗,难以挖掘网络深层次的价值。近年来,深度学习在工业界的大获成功,端到端学习和表征学习越来越受到人们的重视。网络表示学习技术将复杂的图数据向量化,图卷积神经网络实现了图数据的端到端学习,这极大程度上丰富了网络数据挖掘的技术体系,因此利用网络表示学习技术可以进一步获得金融股权网络的深层次价值。金融股权网络结构复杂多变,为进一步揭示网络内在结构,引入资金社区的概念来对金融股权网络进行划分,可为股票分类以及股权关系刻画等提供新的思路。论文针对金融股权网络获取了上市公司披露的大量持股数据,对金融股权网络进行资金社区发现,揭示金融网络社区中金融衍生产品之间的关系,然后融合节点投资交易信息进一步提升算法划分的效果,并针对其他金融类网络实现了端到端的学习训练。论文主要工作如下:(1)针对金融股权网络拓扑结构的特殊性质,考虑到经典随机游走的采样策略难以体现金融股权网络中节点结构之间的差异性。提出了一种引入网络拓扑结构编码的随机游走策略,采用哈希映射函数优化节点采样过程,在提升节点采样效率的同时,使得节点嵌入之后的向量能够保持节点的拓扑结构信息。(2)在动态网络中设计实现了基于随机游走的节点嵌入算法,针对金融股权网络的时序特性,将网络连边权重以及节点属性等信息融入到采样过程中,使得表征之后的向量能够更好地捕捉到时域网络的拓扑结构属性,并针对不同的网络数据集,依据其背景含义进行了算法扩展,深入挖掘了网络的价值。(3)针对金融股权网络中存在的大量结构化和非结构化信息,采用GraphSage算法将节点量化过后的信息融合进嵌入方法的表示过程中,对于大规模动态网络数据集,设计了小批量时域节点聚合以及扩展的方式,将图卷积神经网络GraphSage扩展到动态网络模型上,然后针对具体的金融股权网络挖掘任务设计了无监督损失函数训练算法模型并分析对比了实验结果。