基于舞弊三角理论的GA-BP舞弊智能识别与大数据应用研究

来源 :中国商论 | 被引量 : 0次 | 上传用户:wodekechengsheji
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:本文在回顾舞弊识别理论、指标和模型研究相关文献的基础上,以482个舞弊公司和非舞弊公司为研究样本,基于舞弊三角理论选取财务指标、财务增量指标和非财务指标构建综合指标体系,得到GA-BP舞弊识别模型。大数据技术下数据全面化、多维化的特点赋予审计对象,审计过程多元化、复杂化的特征,给审计工作带来新的挑战,将大数据技术和舞弊识别模型创新结合能赋予审计工作以新的生命力,为全面审计提供坚实的基础,提高审计质量和效率。
  关键词:财务舞弊;GA-BP模型;舞弊三角理论;大数据
  中图分类号:F275 文献标识码:A 文章编号:2096-0298(2021)06(b)--05
  近年来国内财务舞弊案件迭出,如2019年的康美药业、康得新以及2020年的瑞幸等,不仅损害了投资者利益和市场可信度,影响证券市场资源配置功能的发挥,还对中国上市公司的声誉造成严重影响。舞弊动因更加复杂多样,舞弊方式不断新式化,国家对上市公司的监管也日益加强,识别公司财务舞弊的方法成为社会焦点。
  本文以舞弊三角理论为基础,结合前人已有研究,构建了基于财务信息与非财务信息的指标体系,共计64个指标,作为智能算法识别舞弊的基础。根据412个公司样本拟合,并用70个样本进行测试,得到了一个精准有效的GA-BP舞弊识别模型。同时将模型进行扩展,为构建一个以数据处理为核心组织,基于大数据技术进行自动分析与识别的审计框架提供了初步方案。
  1 文献综述
  1.1 舞弊动因理论
  孙丽亚(2010)从“三元素”理论出发,分析三元素的内在关系,创建了与舞弊特征相关的识别卡。洪荭等(2012)利用“GONE”理论探究得出影响五项舞弊发生的重大因素。此外,管杨威等(2014)选择“CRIME”舞弊动机五因素论为研究依据,对60个上市公司舞弊与非舞弊样本进行对比检验获得较好应用能力的识别模型。
  1.2 舞弊指标
  彭子坤等(2013)立足非财务指标从舞弊行为的根本原因出发认识该行为,以公司治理信息和外部环境信息来对非财务信息进行分类,分析现在舞弊识别中的缺陷与滞后性。而熊方军(2015)立足财务指标,通过对几十家舞弊和非舞弊公司的16个财务指标构建以Logistic模型为基石的舞弊识别方法,对数据进行剖析后认为:公司财务指标的数据样本容量大小影响着预测正确率,容量越小正确率越高。
  1.3 舞弊识别模型
  夏明等(2015)选取神经网络组合模型,以BP、RPF神经网络的实验结果为基础,提出RPF-BP组合模型,效法于生物体内神经网络,具有较好的自适应及容错性和应用性,为有效识别会计舞弊提供了新的思路和方法。与之不同的是杨贵军等(2019)使用基于Benford律的Logistic模型,创造性地提出创建一个Benford因子并将其带入到Logistic模型。另外,潘梦雪(2019)基于有较高准确率的预测算法随机森林,结合2014—2017年400多家有舞弊行为的公司进行建模验证,得到具有实用价值的风险识别模型。
  由上述的文献可以得知,在舞弊识别模型、指标、舞弊动因理论的选择上,学术界针对不同方向都得到了较为丰富的成果。本文旨在前人研究的基礎上进行创新性优化,以期获得具有更高可信度和实用价值的舞弊识别模型。
  2 GA-BP模型构建
  2.1 神经网络选取
  人工神经网络中的BP(Back Propagation)神经网络应用最为广泛,其常见结构有三层,分别是输入、隐含与输出层,不同层之间的神经元之间可以利用通道进行信息传输。神经元与通道构成了一个非线性有向图,具有很强的学习能力与处理能力,可以根据输入数据修改每条通道的权重,从而映射出未知结构的数据关系。
  该模型的重点在于权矩阵的确定。选取个学习样本,每个样本有个指标值和1个输出值,所以期望输出值构成了目标向量,输出值构成了向量,把与之间的误差逐层逆向传递给上一层,通过不断修正神经元间信号通道的权重来减少误差,当误差减小到预先设定的标准,则学习状态结束。
  2.2 遗传算法优化
  虽然BP神经网络的学习能力较强,但收敛速度较慢,易困于局部最优解,为克服这一缺点选用遗传算法(Genetic Algorithm ,GA)进行优化。遗传算法借鉴自然界遗传机制与适者生存思想,模拟生物遗传进化过程,通过选择、交叉、变异等操作循环繁殖来挖掘最优个体,缩小最优解范围,用于优化BP神经网络模型的权值阈值。
  2.3 GA-BP模型构建
  GA-BP模型算法的主要步骤如下。
  2.3.1 网络初始化
  首先需要确定神经网络的拓扑结构,包括网络层数和权值阈值个数,并赋予初始值,确定网络的学习规则,这里引入动量项,使得学习因子可以根据需要变化。其中
  为学习因子,影响网络收敛速度;为动量因子,影响误差修正力度,一般取0.9。
  2.3.2 种群初始化
  确定染色体的长度并进行编码,产生一个初始种群,每一个都代表网络中一个对应的权重。
  2.3.3 适应度函数
  将网络预测误差绝对值和的倒数作为遗传算法中的适应度函数。
  2.3.4 遗传操作
  (1)选择操作
  根据适应度函数计算个体适应值作为筛选依据,采用轮盘赌注法确定父代染色体,适应度值越大被选中的概率越高,体现了适者生存思想。第个染色体被选中的概率为:
  (2)交叉操作
  根据数值交叉法,以交叉概率对染色体、的第个基因进行交叉操作,产生新个体和,其余部分直接进行复制。
  (3)变异操作
  以突变概率对染色体的第个基因进行突变操作产生新个体。   2.3.5 寻找最优个体
  根据每次计算的适应度值进行判断,若达到设定的精度要求,或循环次数达到所设的最大迭代次数,则循环终止得到最优个体,解码便可获取最优权值、阈值。
  2.3.6 训练BP神经网络
  将最优权值、阈值赋给BP神经网络进行训练,计算输出向量与目标向量的总误差,若未达到预定标准则反向更新权值、阈值,通过正反向的交替过程逐步提高预测精度,如图1所示。
  3 样本及指标体系
  3.1 样本选择
  本文研究数据全部来自证监会、国泰安CSMAR数据库以及沪深证券交易所。
  (1)舞弊样本选择。考虑到处罚决定与行为发生相比存在一定的时滞性,近期存在舞弊行为的公司可能未被处罚,导致被误认为非舞弊公司,本文所选取的舞弊公司样本来源于2015—2019年证监会处罚公告,最终选取了2014—2018年发生舞弊的263个公司。
  样本筛选过程考虑以下方面。由于处罚原因并非都是舞弊,所以擅自改变资金用途、操纵股价等非舞弊行为导致违规的样本需剔除;部分上市公司多年度发生了舞弊行为,为避免样本重复仅选择第一次发生舞弊年份的信息;剔除金融业上市公司,因报表结构与其他行业差异较大;剔除ST公司及上市未满三年的公司,具体如表1所示。
  (2)非舞弊样本选择。为了避免样本规模因素对模型构建产生影响,按照舞弊样本与非舞弊样本1∶1的原则选取对应年度的263个非舞弊公司样本。
  筛选原则为可比性。配对的两个公司资产总额比值控制在80%~120%;具有相同的股票代码开头;所处行业相同,行业划分以证监会行业分类(2012)中的第一级作为依据。非舞弊公司在配对年度需已上市满三年。
  3.2 指标选取
  (1)财务信息指标。根据舞弊三角理论可知财务指标可以在一定程度上反映出公司的经营压力,基于客观性和可行性的原则,本文从偿债能力、经营能力、盈利能力等七大方面选取了典型财务指标,以反映公司的发展状况,如表3所示。
  (2)财务信息增量指标。当公司处于稳定发展阶段时,其财务指标不会发生较大波动,若公司试图通过虚增利润或虚列资产等方式粉饰数据,其相关的财务指标便会发生较大的波动,偏离真实的发展趋势。针对上述23個财务指标分别将舞弊年份与上一年进行对比,求出增量数据ΔX1,ΔX2,…ΔX23,其中是从营业收入变动率与总资产变动率的差距探讨与舞弊的关系。
  (3)非财务信息指标。当公司有较好的治理水平和股权结构,能做到权利相互制衡、职务分离时,则在一定程度上制约舞弊行为发生。本文从机会角度选取股权结构、治理综合信息以及三会情况相关指标。三因素之一的借口可以通过薪酬合理体现,其与高管对公司的不满情绪有反向关系,具体选取17个指标如表4所示。
  4 实证分析
  4.1 独立样本T检验
  在模型拟合过程中,舞弊组与非舞弊组间没有显著差异的指标贡献度较低,故采用独立样本T检验的方法,确定舞弊样本与非舞弊样本对同一指标的表现是否有显著差别,即均值和方差是否来源于同一总体。从而对已选定的变量进行初步筛选,便于高效构建模型。
  为了尽可能保证数据的真实性,减少缺失值对检验的干扰,应剔除指标缺失较多的公司,并删除其配对公司,得到482个公司样本,剩余空缺值用所属的舞弊组或非舞弊组的平均值填补,然后通过SPSS进行检验。
  在分析上述64个指标的独立样本T检验结果时,首先根据莱文方差等同性检验值判断指标是否具有方差齐性,然后选择对应类别的Sig.检验结果,如表5所示。
  共筛选出8个在0.05显著水平下具有显著差异的指标,分别为资产负债率增量ΔX3应收账款周转率增量ΔX6、固定资产周转率增量ΔX8、营业毛利率、财务杠杆、
  营业收入变动率与总资产变动率之差、流通股比例和股东大会召开次数。
  4.2 数据预处理
  因为不同指标的量纲和数量级都有差异,为了消除其对模型的影响,首先应对指标进行标准化处理,具体处理公式为
  
  其中,为第个指标的第个数据,为第个指标的最小值,为第个指标的最大值。
  主成分分析法可进一步浓缩指标,但根据8个指标的KMO和巴特利特检验可知,KMO=0.528不符合主成分分析的前提条件,故不进行降维转换,如表6所示。
  4.3 GA-BP模型训练与分析
  在本文构建的舞弊识别模型中,将筛选出的8个指标作为输入量,是否为舞弊公司作为输出数据,其中-1代表非舞弊,1代表舞弊,用MATLAB2016B进行神经网络训练。
  将482个公司样本分为训练组和测试组,训练组412个样本用于神经网络的学习,测试组70个样本用于对神经网络的有效性进行检验,得到GA-BP模型的识别准确度如表7所示。
  综合来看,不论是训练样本还是测试样本,其对舞弊组识别的准确率都要高于非舞弊组,即倾向于误判为舞弊组。根据预测准确度来看,模型对未知公司的舞弊识别能力较高,大致为79%,说明构建的GA-BP模型可以作为信度较高的舞弊识别模型之一,在未来大数据环境下可以进一步挖掘更具有代表性的指标,探究如何更加有效地利用智能算法识别舞弊行为。
  5 应用与展望
  5.1 大数据在财务审计中的应用特点
  信息化时代使会计信息由孤立的系统变成一个关于财务信息、人力资源、产品生产供应与销售为一体的综合复杂信息系统。而大数据时代的到来,正是使这种信息数据结构由单一、局部变成多维、全面,使得多种舞弊行为更易被分析识别,压缩了企业舞弊空间。
  5.1.1 对象全面性
  大数据时代不再是对单一的财务报表或财务信息进行分析,而是对财务指标与非财务指标多个方面的信息进行分析,对所有可能获得的公司财务信息进行分析,大大提高了审计对象的全面性和审计结果的准确性。   5.1.2 过程便捷性
  大数据分析模式下,因为可以获得全部数据与指标,因此通过智能化选择对实时获得的数据信息进行筛选和处理,对于多个可能性同时进行信息处理,精准找到将要得到的数据结果。
  5.2 大数据在财务审计中的风险
  5.2.1 信息数据更改
  随着电子信息技术日益增强,企业的信息数据面临企业内部与外界两部分干扰,通过公司内部信息技术更改企业数据,达成舞弊结果,外部人员通过信息技术手段恶意更改企业数据,两方面皆会对审计结果产生重大影响。
  5.2.2 信息数据缺失
  电子形式的审计数据存在的稳定性严重依赖于信息系统,因此信息系统平台的安全性与可靠性变得至关重要。其次电子审计数据在传递过程中极易发生更改与缺失,使得审计数据的真实性、可靠性、安全性有极大的隐患。
  5.2.3 系统处理可靠性
  在计算机根据模型进行审计识别时,识别模型对于审计数据处理的结果存在不确定性,即审计模型结果的可信度问题。局限于审计识别模型的科学方法,多数审计模型的结果准确性存在信任问题。
  5.3 大数据对企业财务舞弊的影响
  5.3.1 舞弊动因多元性
  大数据时代下,数据价值的增大使企业生产销售营销面临更加复杂的情况,同时企业财务信息透明化,使得企业之间的竞争压力更加激烈,也可能使得舞弊行为的成本更低,导致舞弊行为的产生。
  5.3.2 舞弊方法多样性
  互联网+财务模式的快速发展使得监管监督机制无法即时更新,导致监管部分失效,某些财务舞弊得以滋生。并且,大数据模式下,数据的关联性、丰富性、庞大性和各种互联网技术的快速发展使财务舞弊产生的方式方法更加多样化。
  5.3.3 舞弊识别弱化性
  互联网时代由于市场发展迅速,识别舞弊行为存在滞后性,市场监管对于舞弊行为的判断能力较弱,所以应建立强力完善的财务审计机制,提高审计人员的能力,获得更加高效有实用性的财务审计工具。
  5.4 大数据与创新财务舞弊识别模型的意义
  随着大数据时代的深化发展,会计审计工作持续更新增进,将会建立更加完善和全面的财务审计机制,纠察各类财务舞弊行为。大数据时代下的财务工作信息化和财务舞弊识别模型的创新在其中有着至关重要的作用。
  5.4.1 财务舞弊模型判断准确性提高
  财务信息系统对于信息处理能力的准确性一直是审计工作的关键因素,预测模型的准确率起着决定性的作用。因此创新财务舞弊模型,创建有可靠性和实用价值的模型给审计人员选择方法上提供了多样性。
  5.4.2 为全面审计提供可能性
  现代企业财务信息化的不断提高,传统升级模式抽样方法忽略了未抽取样本存在舞弊的可能性。而在大数据时代,通过企业信息化平台集中获取数据带入相关审计模型进行综合审计,可以避免此类方法的缺陷,减小企业的舞弊空间。
  5.4.3 提升舞弊行为的审计质量与效率
  大数据时代,审计人员通过计算机等互联网平台对数据进行快速分类和整合,应用智能化快速识别舞弊行为,相比传统审计模式,提升了审计工作的速度与准确性,同时也提升了审计人员的工作技术水平。
  参考文献
  孙丽亚.基于“三元素”理论的企業财务舞弊识别[J].财会月刊,2010(05):5-7.
  洪荭,胡华夏,郭春飞.基于GONE理论的上市公司财务报告舞弊识别研究[J].会计研究,2012(08):84-90+97.
  管扬威,朱卫东.基于CRIME五因素论的ST公司财务舞弊识别[J].财会月刊,2014(16):12-16.
  彭子坤,曾志勇.基于非财务信息的财务舞弊识别问题综述[J].财会通讯,2013(14):55-57.
  熊方军.基于财务指标分析的上市公司会计舞弊识别研究[J].财会通讯,2015(24):3-6+129.
  夏明,李海林,吴立源.基于神经网络组合模型的会计舞弊识别[J].统计与决策,2015(16):49-52.
  杨贵军,周亚梦,孙玲莉,等.基于Benford律的Logistic模型及其在财务舞弊识别中的应用[J].统计与信息论坛,2019,34(08):50-56.
  潘梦雪.基于随机森林的上市公司舞弊风险识别模型研究[D].杭州:杭州电子科技大学,2019.
  高利,芳何磊,李艺玮.企业反贿赂内部审计的主观动因研究——基于世茂集团的案例分析[J].重庆工商大学学报(社会科学版).2020,37(02):75-86.
  Abstract: Based on a review of the literature on Fraud Identification Theories, indicators and models, 482 fraud firms and non-fraud firms were selected as the research samples. According to the Triangle Theory of Fraud, financial index, financial increment index and non-financial index are selected to build a comprehensive index system. GA-BP Fraud Identification Model is Fitted. Under the background of big data, comprehensive and multi-dimensional characteristics of data endow audit objects and audit processes with the characteristics of diversification and complexity, which brings new challenges to audit. Innovative combination of big data technology and Fraud Detection Model can give new vitality to audit, provide a solid foundation for comprehensive audit, and improve the quality and efficiency of audit.
  Keywords: financial fraud; GA-BP Model; Fraud Triangle Theory; big data
其他文献
摘 要:在国家政策的扶持和业内企业的努力下,作为国家科技领域新型基础建设的排头兵,物联网产业已经进入全面布局的快车道。无锡作为全国首个建设物联网示范区的城市,全力发展物联网产业,推动物联网与生活出行、实体经济和城市建设融合发展,为实现经济高質量发展助力。本文从产业协同创新和新基建政策支持的角度,阐述新基建背景下无锡物联网产业以及内部优势企业的发展现状,分析无锡物联网产业面临的问题及挑战,并提出产业
实施乡村振兴战略是实现社会主义现代化的必由之路.西部地区作为脱贫攻坚的主要战场,乡村脱贫的质量将决定打赢脱贫攻坚战、决胜全面建成小康社会的全局.文章以西部地区的贫
在当下,市场竞争压力不断加大,为增强自身竞争力,抢占市场份额,部分中小型企业在销售的过程中,广泛应用到赊销这一模式,虽然提升了销售能力,降低了库存风险,提高了中小型企业的市场竞
在大数据、云计算、人工智能等新一代数字技术的推动下,数字化转型成为企业应对复杂环境的必由之路.现有文献对数字化转型给企业带来的影响及浙江省企业转型升级进程进行了分
摘 要:现阶段,高校大学生创新创业能力的培育在高校教育中十分重要,在市场经济快速发展的今天,对于大学生的综合素质和实践能力也提出了更高要求。大学生创新创业能力的培育有利于提高学生的创新意识、创业技能,使其成为更加适应社会发展的综合型人才。高校大学生创新创业能力的培养于学生本身而言有助于其增强社会竞争力,更加适应市场经济发展的需求;于高校而言,推动了高校教育的创新性改革,有利于培养出更多高素质创新型
【关键词】创新型企业;持续创新;驱动源;动力机制  【中图分类号】F271 【文献标识码】A 【文章编号】1674-0688(2021)05-0001-04   创新成为企业发展面临的新常态,持续创新成为企业持续发展的原动力。在复杂多变的经营环境下,特别是技术更新与变革的不断迭进、新竞争者与新市场的不断崛起、企业新陈代谢的不断提升,创新型企业可借助持续创新,寻找企业生存发展的重大机遇,有效应对经
【关键词】专利意识;增强;科技成果转换;专利保护  【中图分类号】G306.3 【文献标识码】A 【文章编号】1674-0688(2021)05-0007-03   当今,全球各国日益重视知识产权保护,我们也必须加快变革思想,健全激励制度,建立知识产权保护和科学成果相结合的管理模式。尽管科技成果属于知识财富的范畴,然而其无所有权和财产权。知识产权属于无形财产权,是劳动者根据有关法律法规享有其成果
摘 要:过去三十年,天使投资和风险投资行业方兴未艾。特别是近十年,中国的创业大潮兴起,很多的创业企业借助资本的力量迅速崛起,甚至成为各个细分领域的独角兽,相比过去传统企业,现在企业在外力作用下的成长和迭代速度越来越快。一方面,资本加速企业的成长,是正向的推动力;另一方面,每一个资本都有自己的时间期限,不能无限期陪跑企业,在合适的时机资本也会寻求退出。所以,投资方在最初签订的投资协议中一般都有关于回
近年来随着社会的不断发展,我国社会保障制度也越来越完善,城乡居民养老保险的存在不仅提高和改善了城乡居民生活水平,也推动了我国经济的发展,但是目前城乡居民养老保险在实际应
摘 要:当前陆域资源日益紧缺,生态环境不断恶化,诸多国家将注意力投向发展海洋经济。本文通过对美国、日本等海洋经济发达国家和地区的发展模式、政策制定等进行比较分析,结合我国实际,提出对中国海洋金融发展的建议,以期为中国金融支持海洋经济的发展提供有益的经验借鉴。  关键词:金融支持;海洋经济;经验借鉴;海洋产业;投资  中图分类号:F832 文献标识码:A 文章编号:2096-0298(2021)06