基于XBRL层次结构的数据挖掘研究

被引量 : 0次 | 上传用户：tank12134

【摘要】

：

XBRL作为一种基于XML的可扩展性商业报告语言，目前已广泛应用于财务系统中。该语言拥有技术规范，分类标准和实例文档三层结构关系，技术规范规定了XBRL所需遵循的语法规范和相关

【作者】

：

闫亚丽

【发表日期】

：

2014年期

【关键词】

：

XBRL 关联规则 XQuery DC‐Apriori算法

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

XBRL作为一种基于XML的可扩展性商业报告语言，目前已广泛应用于财务系统中。该语言拥有技术规范，分类标准和实例文档三层结构关系，技术规范规定了XBRL所需遵循的语法规范和相关技术标准，分类标准则依赖于技术规范和会计准则，由模式文件和链接库构成，实例文档则是在XBRL技术规范和分类标准的基础上产生的一种商业报告语言，它存储了企业财务的详细数据，用来通过互联网传达信息。而数据挖掘与XBRL层次结构的融合给我们的数据分析带来了便利。因企业财务数据越来越多，利用数据挖掘方法挖掘出我们需要的信息显得极为重要。XBRL核心思想为先提取数据源，再将数据源文档转化为xml文档，然后通过文档转换器转换为XBRL格式，XBRL格式文档就可以存储于用户数据库系统或上传于浏览器中供用户数据分享。数据挖掘便是从XBRL文档中提取有关信息加以分析提炼出我们需要的数据。数据挖掘的一般过程为数据采集，数据预处理，数据挖掘，数据展示，通过数据挖掘中关联规则的Apriori算法与XBRL层次结构相结合，本文提出了一种基于XBRL层次结构的数据挖掘模型架构，该模型架构包括数据提取转换，X‐Hive数据存储，关联规则挖掘，结果展示四大模块，该模型综合了XBRL层次结构思想，符合数据挖掘相关流程，并利用数据挖掘中的关联规则方法和XQuery查询思想对存储于X‐Hive数据库中的XBRL数据做深度挖掘。在对X‐Hive数据库进行XBRL数据挖掘的过程中，通过对Apriori算法进行改进，提出了一种基于X‐Hive数据库的DC‐Apriori挖掘算法，从而对XBRL的数据挖掘更加高效。实验表明：在X‐Hive数据库中采用DC‐Apriori算法进行XBRL关联规则挖的方法是可行的、行之有效的,并且挖掘效率高于关系数据库中应用Apriori算法的效率。

其他文献

静脉用药集中调配模式下静脉输液治疗的风险与防范

分析静脉用药集中调配模式下静脉输液治疗在用药医嘱处理、静脉输液成品接收、静脉输液治疗执行3个环节的潜在风险，针对性提出有效的防范措施，旨在保障临床用药安全。

期刊

静脉用药集中调配静脉输液治疗风险防范

甲状腺乳头状癌围手术期血钙和甲状旁腺激素的监测及其临床意义

目的：研究甲状腺乳头状癌患者围手术期甲状旁腺激素和血钙的变化，以及甲状旁腺分泌水平与术后发生低钙血症的关系。探索早期预测及治疗术后低钙血症的方法。方法：选择2011年03月

学位

甲状腺术后甲状旁腺功能减退症低钙血症

基于吸收式换热的热电联产集中供热系统配置与运行研究

发掘热电联产的节能潜力，提高热电联产集中供热的可实施性，已成为我国节能工作的一项重点任务。针对目前热电联产供热能力不足、集中热网输送能力不足的瓶颈问题，清华大学提出了

学位

热电联产余热利用吸收式换热配置与运行

个案工作在工伤患者服务中的应用

我国经济迅猛发展的同时，生产安全事故频发。在劳动力市场总体上供大于求，劳动力市场供需存在不平衡的情况下，劳动者的弱势地位就更加明显。工伤患者在住院期间,由于对维护自身

学位

医务社会工作个案社会工作工伤患者

香菇段木栽培技术

香菇段木栽培技术张飞翔段木栽培香菇是使香菇在树干上生长，树木便是香菇生长的营养物质基础。各种树木所含的成分不同，木材的质地不同，常常影响产菇的早晚、产菇的数量、质量及

期刊

段木栽培香菇菌丝

面向战略采购的A公司供应商开发与管理研究

随着经济全球化的不断深入，科技信息化的持续推进，企业之间竞争的日趋激烈。采购作为影响产品成本和质量的重要组成部分，已经被企业逐步的加以重视，并被列为企业的核心部门。传统

学位

战略采购管理供应商的开发与选择供应商管理AHP层次分析法ABC物料分析法集中采购

瑞士创新生态系统的核心特征及对我国创新体系建设的启示

瑞士作为一个国土面积狭小、自然资源匮乏的国家,在创新发展方面却取得了卓越的创新绩效,连续9年在世界知识产权组织发布的全球创新指数中蝉联世界第一。其突出的创新绩效源

期刊

瑞士创新生态产学研融合创新体系

数字化潜能:还有八成以上未开垦!

<正>在数字化推动下本应催生的生产力收益并未广泛地体现在经济领域。《哈佛商业评论》今年1月发表文章称,研究表明,单就美国而言,其经济中的数字化潜能迄今仅释放了18%,而若

期刊

领跑者生产力《美国创新战略》监管体系巴宝莉数字化战略

改革开放40年我国研究生招生政策的变迁逻辑与发展走向

改革开放40年来,我国研究生招生政策经历了改革大潮中恢复重建(1978-1985)、系统调整中稳步推进(1986-1997)、法制规范中加速发展(1998-2012)以及深化改革中内涵提升(2013年

期刊

研究生教育研究生招生政策变迁逻辑发展走向

多元化教学方法在小学语文教学中的应用

新课改的深入发展推动了我国教育体系的变化，在日新月异的知识经济时代，小学语文教学质量与教学效率成为教育者所关注的主要问题。多元化教学方法的应用可以改变传统的教学模式

期刊

小学语文教学方法多元化特点实施

基于XBRL层次结构的数据挖掘研究

其他学术论文