融合知识图谱和情感分析的股价预测模型

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:dldx05444011
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自股市诞生之后,股票预测问题就受到了来自金融领域和计算机领域的众多研究者的关注。随着深度学习的发展,历史股价、新闻、论坛等数据被各种各样的深度学习模型运用于股票预测问题。然而,其仍然面临着诸多难题,例如财经新闻数据大、涉及面广,当财经新闻中未直接出现上市公司名称时,难以预测受该新闻影响的上市公司,即财经新闻的相关公司挖掘问题;上市公司之间存在复杂多样的关系,公司间相关性建模困难等问题。针对上述挑战,本文构建了金融知识图谱以挖掘新闻文本涉及的公司和公司之间的相关性,并基于实体链接和知识图谱嵌入等技术,提出了一种新颖的基于图神经网络的融合了知识图谱和情感分析的股价趋势预测模型。围绕股票预测问题,本文的主要工作包括:1)使用爬虫技术从同花顺网站上爬取上市A股公司的公开数据。然后,基于领域规则进行数据清洗,并使用Protégé构建本体。最终,在图数据库中构建了国内A股上市公司的金融知识图谱(A-shares Knowledge Graph,AsKG)。AsKG目前包含 256,141 个实体和 443,874条关系。2)设计了一种利用金融知识图谱AsKG有效挖掘财经新闻相关公司信息的策略。首先,使用改进的序列标注模型BERT-BiDT-CRF从新闻文本中获取关键实体。然后,基于实体词典和Elasticsearch索引使用字符匹配的方法进行实体链接,得到关键实体在AsKG中对应的节点。最后,采用基于束搜索的节点搜索算法借助AsKG存储的领域知识,获取对应的公司名称。3)构建了以上市公司为节点,公司间相关性为边的股价趋势预测图,其节点特征由历史股价数据和财经新闻的情感分析算法结果组成。边特征由历史股价的统计信息和AsKG的嵌入(Embedding)信息表示。利用图神经网络对股价趋势预测图进行分析,进行股价趋势预测。针对上述算法,本文进行了分阶段的实验,并构建了同花顺网站的财经新闻数据和沪深300的股票价格数据的实验数据集。在该数据集上,对本文提出的股价趋势预测模型的有效性进行了实验验证。实验表明,本文提出的股价趋势预测模型是有效的,其性能优于基准模型ARIMA。
其他文献
随着云计算、物联网、大数据等信息化技术的快速发展,人们对网络终端设备的依赖性日益增加,社区、企业、学校等场景下的网络数据环境日益复杂。由于缺乏对网络数据的监控与管理,诸如数据泄露、DDo S攻击、家用摄像头入侵等网络安全问题日益凸显。目前,基于软件层面的传统网络数据监控与管理方案具有处理能力、处理时延、资源消耗等方面的局限性。结合应用场景与项目需求,本文自主设计并实现了一套基于FPGA的网络数据管
随着经济的日益发展,无人驾驶在汽车驾驶中的地位越发重要,在无人驾驶中车辆进行各种驾驶决策的关键一环是道路检测。然而现有的应用于道路检测的多模态数据融合方法由于未能降低LiDAR点云数据之间的距离,导致在道路检测中会出现检测过程时间开销大的问题。本文通过将LiDAR点云数据和视觉图像数据两种异源数据通过球面坐标变换进行数据级融合,并使用改进的SegNet进行道路检测,以此实现一种高精度低时延的道路检
学位
厌氧膜生物反应器(anaerobic membrane reactor,AnMBR)作为一种应用广泛的有机固体废物处理工艺,利用有机物产生沼气的同时实现剩余污泥的减量化,在技术和经济上具有很大的优势和前景。目前,AnMBR在实际应用中面临诸多技术难题,如厌氧消化性能低、消化残渣处理难、膜污染严重等。共消化是一种简单高效处理有机固体废物的技术,在提升厌氧消化性能、缓解膜污染等方面有极大的应用潜力。基
图像配准和图像分割是医学图像处理中的两项关键技术,在疾病诊断、手术导航、疗效评估等实际医疗场景中发挥着非常重要的作用。传统的医学图像配准和人工分割耗时较长,且对医生的专业水平要求较高。随着医学图像种类和数量的激增,医生的工作负担显著增加,从而导致漏诊和误诊的现象发生。近些年来深度学习的快速发展,吸引了越来越多的研究人员将深度学习引入医学图像配准和分割任务中,利用计算机来辅助医生进行诊断,提高医生的
蓝藻水华一直是全球性重大环境问题,对蓝藻进行环境友好的处理与处置是关系国计民生的重要研究课题。蓝藻富含蛋白质、碳水化合物、脂类等营养物质,蓝藻的高值化再生资源回收利用成为近年来的研究热点。通过厌氧发酵对蓝藻进行资源化利用具备广阔应用前景和实践意义。但蓝藻细胞独特的刚性结构导致厌氧发酵效率不高,为强化蓝藻厌氧发酵效率,需针对蓝藻实行一定的预处理。目前已公开的蓝藻厌氧发酵预处理方法不多,因此,亟需开发
学位
随着半导体技术的迅猛发展,突破物理尺寸的限制变得越来越困难,纳米线环栅已成为5nm以下技术节点的核心器件结构。而可重构场效应晶体管器件(RFET)得益于其自身的结构特点,通过极性栅(Program gate,PG)调控流经沟道内载流子的类型,在一个晶体管内可实现N型导电与P型导电的动态可重构,拓宽了传统晶体管的功能。这样通过RFET的可重构特性,从而可以达到使用较少数目的晶体管去实现更加丰富的逻辑
网络管理机制的核心就是对网络设备进行监控然后根据监控结果发送操作指令。传统的分布式网络管理采用SNMP、Netflow等网络管理方式,在应对不断增长的网络规模下已逐渐不满足要求。例如在数据中心网络中,传统的网络管理方式无法适配数据中心网络大规模、低时延、不可预期等特征。在软件定义网络(SDN)架构下,转控分离和数据面可编程的出现,使得有能力实现低时延监测的带内网络遥测(INT)发挥出了优势。所以,
混成系统是同时包含连续状态和离散状态的动态系统。连续部分通常模拟物理环境的相互作用,而离散部分通常模拟控制系统的运行。计算和控制的结合会导致非常复杂的系统设计,因此混成系统常被应用于航空航天、汽车工业和工厂自动化设计中。到目前为止,混成系统中使用了多种形式化建模方法:混合自动机、混合Petri网、Modelica、Zelus等。对于混合系统的形式化验证,可以使用多种工具,如Hy Tech、PHAV