基于随机森林算法纳税遵从风险识别研究

来源 :中国财政科学研究院 | 被引量 : 1次 | 上传用户:yanjie99826
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着经济体制改革的全面深化,税收环境发生变化,税务机关与纳税人之间的博弈日益激烈。2014年9月国家税务总局发布了《关于加强税收风险管理工作的意见》,提出要以风险管理为导向,借助信息化工具进行对征管活动的监控和管理决策的制定,加强规范税收风险管理工作。纳税遵从风险识别是税收风险管理工作的基础。随着金税三期的全面推广,纳税人向税务机关提供财务数据及纳税申报数据。一般来说,财务数据的产生遵循大致相同会计准则,通过较为共性的会计核算方式反映了企业生产经营状况,是税款计算的主要经济基础数据。使用随机森林等机器学习算法构建并训练纳税遵从风险识别模型,对税收大数据进行深度挖掘,通过对全样本的相关性分析,去除人为因素的干扰,对应纳税额进行预测,并与企业实际申报的应纳税额比较,可以对纳税遵从风险进行有效的识别,并进行重要性排序,辅助税务工作人员进行纳税遵从风险管理。目前从纳税人申报和财务数据等基础大数据出发,应用机器学习算法进行纳税遵从风险识别的研究较少。本文以纳税遵从风险理论和随机森林算法理论为基础,区分了纳税遵从风险与其他涉税风险,总结了国内外纳税遵从风险识别的方法,在介绍随机森林算法在B税务局纳税遵从风险识别的应用研究案例背景的基础上,阐述了B税务局进行纳税遵从风险识别时存在的预警值设置依赖经验判断、关键指标难以界定等问题,按照数据挖掘流程从业务解释、数据的采集和预处理、模型构建、模型检验、结果输出和模型评价对模型的应用进行分析,实现了对纳税遵从风险的量化衡量,进行了重要性排序,得出应客观地对待随机森林算法输出结果、强化数据管理、建立大数据人才培养体系和以大数据分析为依托实行税收专业化管理。希望能对我国税务机关进行纳税遵从风险识别有一定的参考意义。
其他文献
目的 探讨绝经前行单纯子宫切除后卵巢功能变化机制及相关疾病多发的危险因素。方法 利用放免方法测定 36例绝经前单纯切除子宫患者血中E2 (雌二醇 )、P (孕酮 )、LH (促黄
目的:探讨我院近年来住院患儿抗生素使用现状和细菌耐药的发生率。方法:利用我院信息中心、院感染科和中心实验室提供的数据和药敏情况,对2001年1月~2006年5月儿科、新生儿科
多层次资本市场是市场体系的重要组成部分,对新常态下首都经济社会发展具有重大意义。当前,首都多层次资本市场建设已具有一定基础。面对"十三五"时期首都经济社会发展的新形
选择性吸附脱硫技术是燃料油深度脱硫技术领域研究与开发的重点课题之一。本文采用微波辅助-液相离子交换法制备了一系列单金属改性和双金属改性Y分子筛脱硫吸附剂,在吸附剂物
<正>近日,国务院正式批准设立中国(上海)自由贸易试验区。试验区范围涵盖上海市外高桥保税区、外高桥保税物流园区、洋山保税港区和上海浦东机场综合保税区等4个海关特殊监管
当代大学生需要在社会角色、社会地位、社会责任、社会作用等方面优于或重于一般社会成员的自我意识,需要有主体意识、忧患意识和责任担当意识。大学生拥有精英意识是实现其
体操山羊分腿腾跃是近几年在国家和省市教师基本功和教学展示课中不可缺少的项目。山羊分腿腾跃对学生身体和心里素质的提高、基本能力的发展,意志品质的培养具有不可替代的
本文使用工业企业数据库,测算了如果金融业实行"营改增"可能给制造业企业带来减税效应,分析了该影响在不同地区、出口选择、行业要素密集度、行业、所有制类型的企业群组中的
作为我国结构性减税和产业结构优化的重大举措,房地产行业纳入"营改增"势在必行。本文在对房地产行业以及其上游行业"营改增"后增值税税率进行预测的基础上,通过相关模型,测