基于数据挖掘的上市公司财务违规识别研究

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户:qqq123456123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,我国市场经济前景广阔,上市公司众多。我国经济正处于快速发展阶段,但相关机制不太完善,导致上市公司财务违规行为频发,虽然已经采取监管措施打消了部分上市公司财务违规行为,但仍存在一些问题。有的公司为了自身利益而造假财务状况并向证券市场传递未经审计的财务报告,所以如何有效过滤和抵制上市公司财务违规对现在的中国证券市场是一个关键问题。在此背景下,本文对各种识别财务违规模型进行了研究及改进,对模型的识别效果进行了分析,这体现了一定的现实意义。首先,本文基于上市公司违规数据库,从国泰安数据库中选取2010-2019年因财务违规受到惩罚的上市公司,最终确定3035个违规样本。根据对照原则,选择同年、同行业和同规模的3035个非违规作对照样本;其次,按照全面性、可行性和客观性从财务指标和非财务指标对公司整体情况进行刻画,初步选出了46个初始指标,进行显著性检验后筛选出了42个指标。将这42个指标分别用随机森林、Boruta和Relief算法进行特征选择;然后,将三种特征选择算法选择的指标与未经指标筛选的原始指标相结合,形成的数据集分别在KNN、随机森林、朴素贝叶斯、支持向量机、决策树和XGBoost这六种模型下进行检测识别。通过对不同评价方法的评价后,找到了最有效的模型是经过随机森林算法筛选后的指标组合与随机森林结合的模型;最后,为了得到更好的模型效果,构建Stacking集成算法模型。通过对比发现,用随机森林特征选择后的随机森林模型和Boruta算法特征选择的XGBoost模型作集成融合时,Stacking集成识别模型效果最好,在评估指标和适应性等方面都有不错的表现。因此可以得到结论,Stacking选择性集成算法集成了各个分类算法的特点达到了博采众长的目的,在识别上市公司是否财务违规问题上有较大的应用价值。同时为了验证本文模型的应用价值,基于Stacking集成模型识别并预测出2020年上半年上市公司发生财务违规的概率和类别,这有助于上市公司监管机构和审计机构利用模型预测结果进行进一步判断与决策,表明了本文的研究具有很好的应用价值。
其他文献
由于概率图模型便于建模变量关系、概率推理以及知识发现,所以其思想在人工智能前进的浪潮中发挥了十分重要的作用,最近更是有一些神经网络结合概率图思想的研究在某些问题上取得了state-of-the-art的结果。另外,无论是计算机硬件不发达的上个世纪,还是大数据时代的到来,提高算法性能都至关重要,而这一点在并行程序设计理论中找到了不错的解决方案。作为一名统计学学生,本文在研究了大量计算机理论的基础上,
学位
近年来,伴随着互联网技术的高速发展以及人们生活水平的日益改善,人们开始热衷于在挑选在线旅行产品时通过浏览在线旅游网站或互联网旅游平台的产品点评或游记等内容来寻找适合自己的旅游景点。然而,由于各大网络旅游平台的用户量迅速增多,越来越多的消费者开始在旅游平台上分享自己的旅游体验和感受,各类评论内容也多样繁杂。这些信息一方面能够为其他消费者提供指引,另一方面也使得消费者在挑选旅游产品时难以获得优质、适合
学位
伴随着司法智慧化的广泛开展,人工智能技术可以辅助专业人士提高工作效率,提升群众法律意识。对于法律行业相关人员来说,各级法院在案件审判之后记录的裁判文书具有具有宝贵的研究意义。不论是群众在自身面对纠纷想要寻求专业帮助或是法官进行案件审判前进行参照时,过往类案都能起到参考辅助、有效解决量刑偏差的作用。因此从技术层面利用计算机自动查找出相似司法案件,减少人工成本和主观偏差具有很高的研究价值。为了保证类案
学位
中小企业的健康成长,关系到国计民生,在我国经济发展中具有重要的地位。而我国中小企业一直面临的融资难、融资贵等问题限制了其发展。近年来,以大数据、区块链、云计算等为技术支持的金融科技不断发展,一方面增加了企业的融资途径,缓解了其面临的融资约束;另一方面也使得金融服务机构利用技术手段降低了服务成本,提升了企业的融资效率,加速了中小企业的发展进程。本文从融资约束与技术创新两个视角,探讨金融科技对中小企业
学位
近年来,我国科技创新能力保持较快发展,取得了一系列的科技创新成就,但是发展过程中各区域的不均衡问题突出,对科技创新能力整体的提升起到了阻碍作用。因此对区域科技创新能力进行测度、探索区域科技创新能力空间关联性,有助于了解全国科技创新能力的发展水平与分布差异性,并在此基础上对症下药,对区域科技创新能力的提升具有重大意义。本文首先对相关文献进行了梳理,明确了研究内容与研究方法,从科技创新投入、科技创新环
学位
随着互联网技术的高速发展,网上购物逐渐走入人们的视线并成为日常生活中不可或缺的一环。同时,由于在线评论的简便性,人们随时随地可以在网络上发表自己的看法,这也让越来越多的用户倾向于在网购后分享自己对于这些产品的看法。这些琐碎的评论信息中包含着巨大的研究价值,往往是其他用户在决策过程中的重要参考信息,但网络评论的数量极为庞大且对阅读者的有用性水平不一,单凭人力很难快速定位出高质量的评论,基于这一点,本
学位
在教育现代化进程加速推进的情况下,在对小学科学学科核心素养进行培养的过程中,对小学科学课堂教学追求品质教学、打造品质课堂、培养品质学生的呼声越来越高。文章通过实际教学实践和研究,对农村小学科学课程校本化的实施进行了探讨。论文首先介绍了农村小学教学现状以及校本课程实施的背景,然后明确了校本化课程实施的目标和原则,最后提出了小学科学课程校本化的教学实施策略,并通过具体例子加以证明,以期达到高质量教学、
期刊
近年来,人们对于医疗保健的需求持续增长,医疗资源正逐渐面临供需不平衡的局面,互联网的飞速发展带来了诸如好大夫在线、微医网、阿里健康等一大批在线医疗社区平台兴起,另外,新冠疫情的爆发与持久性,增加了人们对于医疗保健的关注,同时也更大程度的促进了在线医疗平台的发展。使用在线医疗平台就留下了很多的用户评论,通过对在线医疗评论的分析挖掘可以对我国的在线医疗平台的发展情况有一个清晰客观的评估,同时可以进一步
学位
个人信用风险评估对于商业银行和开展信贷业务的金融机构来说是一个非常重要的问题,他们在处理贷款业务时需要非常谨慎以避免任何财务损失的不当决定,依赖人工手段判断放贷风险既耗费时间也耗费资源,设计实现提供信用评估的编程模型可以使发放贷款更加科学和高效。信用评估模型的优劣会对信贷机构损益和金融市场秩序产生影响,且不同信贷业务领域所获得信贷信息也有许多差异。随着信息技术的发达,个人信贷数据呈现出复杂化、量级
学位
随着经济的发展,金融市场越来越深不可测,其特征波动规律难以掌握,因此专注于股市波动的研究对于广大散户意义重大。一方面,研究股市规律能对社会、经济和金融的发展起到明显而有效的促进作用;另一方面,也可以通过科学方法有效地控制市场风险从而获得收益。近年来,国内外众多学者都专注于波动性的研究,其中金融时间序列模型和神经网络模型不断发展且趋于稳定,它们被广泛应用于金融市场等各个领域中。由于单一模型在应用过程
学位