论文部分内容阅读
随着信息技术的普及,通过IT技术实现对互联网涉税情报的采集和处理,从而拓展涉税情报获取渠道,实时全面掌握税源信息是深化税收改革的重要举措。建立一个通用涉税情报处理平台是推动数据管税项目应用的关键部分。通过涉税情报处理平台的建设,为互联网税源的管理提供情报采集和处理功能,进而可缓解税收征管中征纳双方信息不对称的矛盾。目前已有的互联网涉税情报处理系统在通用性和有效性方面还不能满足数据管税和互联网税源管控的需要。本文在研究分析了地税机关在互联网税源数椐采集和涉税数据处理的应用需求的基础上,设计并实现了一个高性能的涉税情报处理平台系统,为咸阳地税局在推进数据管税综合应用平台项目提供数据支撑。在涉税情报处理平台解决方案和数据管税项目实施的过程中,本人承担涉税情报处理平台的开发和测试工作。所做的具体工作主要有:首先,在对涉税情报处理平台进行总体分析和功能需求分析、质量约束设计的基础上,通过UML建模和各种逻辑视图分析了涉税情报处理平台的功能结构和数据需求,给出了系统的需求方案和构架方案。接下来,按照系统组件服务功能定义进行了涉税情报处理平台的架构设计,并根据系统需求分析的内容进行了系统功能模块的设计与实现。在这部分选取了网页涉税情报采集模块、涉税情报匹配归集处理模块以及涉税情报查询展现模块的设计和实现来对涉税情报处理平台的解决方案的实施过程进行说明。在涉税情报采集模块中,应用网络爬虫技术在改进主流的Heritrix爬虫应用框架的基础上进行爬虫组件的设计与实现,保证涉税情报处理系统正确执行涉税数据的采集工作。在涉税情报匹配处理模块中,采取了一种基于字段的智能匹配策略完成涉税情报信息自动与征管系统中企业基本信息的匹配,并按户进行归集,为涉税情报的分析工作提供依据。在涉税情报查询展现模块,采用横向展示和纵向展示两种查询展现的策略展示涉税数据。最后,完成整个涉税情报处理平台的验证和应用部署工作。在系统开发工作完成之后,运用多种系统测试方法对给出的涉税情报处理平台进行系统测试,并对测试中发现的问题进行反复的修改和再测试,直到系统达到验收标准。最后,在咸阳地税局完成涉税情报处理平台的部署。目前,该涉税情报处理平台系统经过测试和在咸阳地税局的投入使用,结果表明,该系统运行效果良好,可以为数据管税综合应用平台提供切实可靠的数据支撑,为互联网税源管控提供切实可行的解决方案。同时,给出的涉税情报处理平台运行的可行性和有效性达到了设计要求。