基于XBRL层次结构的数据挖掘研究

被引量 : 0次 | 上传用户:tank12134
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
XBRL作为一种基于XML的可扩展性商业报告语言,目前已广泛应用于财务系统中。该语言拥有技术规范,分类标准和实例文档三层结构关系,技术规范规定了XBRL所需遵循的语法规范和相关技术标准,分类标准则依赖于技术规范和会计准则,由模式文件和链接库构成,实例文档则是在XBRL技术规范和分类标准的基础上产生的一种商业报告语言,它存储了企业财务的详细数据,用来通过互联网传达信息。而数据挖掘与XBRL层次结构的融合给我们的数据分析带来了便利。因企业财务数据越来越多,利用数据挖掘方法挖掘出我们需要的信息显得极为重要。XBRL核心思想为先提取数据源,再将数据源文档转化为xml文档,然后通过文档转换器转换为XBRL格式,XBRL格式文档就可以存储于用户数据库系统或上传于浏览器中供用户数据分享。数据挖掘便是从XBRL文档中提取有关信息加以分析提炼出我们需要的数据。数据挖掘的一般过程为数据采集,数据预处理,数据挖掘,数据展示,通过数据挖掘中关联规则的Apriori算法与XBRL层次结构相结合,本文提出了一种基于XBRL层次结构的数据挖掘模型架构,该模型架构包括数据提取转换,X‐Hive数据存储,关联规则挖掘,结果展示四大模块,该模型综合了XBRL层次结构思想,符合数据挖掘相关流程,并利用数据挖掘中的关联规则方法和XQuery查询思想对存储于X‐Hive数据库中的XBRL数据做深度挖掘。在对X‐Hive数据库进行XBRL数据挖掘的过程中,通过对Apriori算法进行改进,提出了一种基于X‐Hive数据库的DC‐Apriori挖掘算法,从而对XBRL的数据挖掘更加高效。实验表明:在X‐Hive数据库中采用DC‐Apriori算法进行XBRL关联规则挖的方法是可行的、行之有效的,并且挖掘效率高于关系数据库中应用Apriori算法的效率。
其他文献
分析静脉用药集中调配模式下静脉输液治疗在用药医嘱处理、静脉输液成品接收、静脉输液治疗执行3个环节的潜在风险,针对性提出有效的防范措施,旨在保障临床用药安全。
目的:研究甲状腺乳头状癌患者围手术期甲状旁腺激素和血钙的变化,以及甲状旁腺分泌水平与术后发生低钙血症的关系。探索早期预测及治疗术后低钙血症的方法。方法:选择2011年03月
发掘热电联产的节能潜力,提高热电联产集中供热的可实施性,已成为我国节能工作的一项重点任务。针对目前热电联产供热能力不足、集中热网输送能力不足的瓶颈问题,清华大学提出了
我国经济迅猛发展的同时,生产安全事故频发。在劳动力市场总体上供大于求,劳动力市场供需存在不平衡的情况下,劳动者的弱势地位就更加明显。工伤患者在住院期间,由于对维护自身
香菇段木栽培技术张飞翔段木栽培香菇是使香菇在树干上生长,树木便是香菇生长的营养物质基础。各种树木所含的成分不同,木材的质地不同,常常影响产菇的早晚、产菇的数量、质量及
随着经济全球化的不断深入,科技信息化的持续推进,企业之间竞争的日趋激烈。采购作为影响产品成本和质量的重要组成部分,已经被企业逐步的加以重视,并被列为企业的核心部门。传统
瑞士作为一个国土面积狭小、自然资源匮乏的国家,在创新发展方面却取得了卓越的创新绩效,连续9年在世界知识产权组织发布的全球创新指数中蝉联世界第一。其突出的创新绩效源
<正>在数字化推动下本应催生的生产力收益并未广泛地体现在经济领域。《哈佛商业评论》今年1月发表文章称,研究表明,单就美国而言,其经济中的数字化潜能迄今仅释放了18%,而若
改革开放40年来,我国研究生招生政策经历了改革大潮中恢复重建(1978-1985)、系统调整中稳步推进(1986-1997)、法制规范中加速发展(1998-2012)以及深化改革中内涵提升(2013年
新课改的深入发展推动了我国教育体系的变化,在日新月异的知识经济时代,小学语文教学质量与教学效率成为教育者所关注的主要问题。多元化教学方法的应用可以改变传统的教学模式