基于知识图谱的结构化数据分类算法研究

来源 :计算机时代 | 被引量 : 0次 | 上传用户:lwj2005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据的自动分类有利于实现数据高效管理。针对政府结构化库表数据中标签数据少、数据交叉多所导致的分类难点问题,提出了结合知识图谱的政府结构化库表数据自动分类算法。以政务知识图谱为核心,结合BERT、TF-IDF、LDA模型形成了无主题、单主题、多主题分类器,通过组合三个分类器共同实现政府结构化库表数据的自动分类。经实验表明,该方法与传统短文本分类算法相比,在准确率、召回率和F1值上均较大提升,表现出了良好的分类效果。
其他文献
<正>公司是现代社会伟大的发明,推动了人类社会经济的快速发展。公司的良好秩序运行,需要法律去监管和约束。我国《公司法》于1994年7月1日施行,确定了现代企业企业制度,重点规定了公司的设立条件、组织结构、股权转让、公司财务会计及股东权利等相关制度。至今共进行了一次修订和四次修正,《公司法》立法改革方向由政府监管到企业拥有更多的自主管理权,充分发挥了公司主观能动性,公司发展效果立竿见影。
期刊
<正>近日,联合国第五次环境大会通过了由秘鲁、卢旺达、日本提出的,由欧盟背后推动的《结束塑料污染:达成一项具有法律约束力的国际协定》的决议,旨在就塑料污染,包括海洋环境中的塑料污染治理,启动建立政府间谈判工作机制,力争到2024年制定一项具有法律约束力的国际协定。该协议一旦达成将成为自2015年《巴黎协定》签署后新的具有广泛影响的环境协定,
期刊
<正>习近平总书记在党的二十大报告中强调:“全面推进乡村振兴,坚持农业农村优先发展,巩固拓展脱贫攻坚成果,加快建设农业强国,扎实推动乡村产业、人才、文化、生态、组织振兴,全方位夯实粮食安全根基,牢牢守住18亿亩耕地红线,确保中国人的饭碗牢牢端在自己手中。”党的十八大以来,习近平总书记始终高度关注农业、关心农村、关爱农民,就做好“三农”工作发表了一系列重要论述,科学回答了农村改革发展的一系列重大理论
期刊
从认知语言学的观点出发,对中原武术谚语的隐喻特征进行了研究,认为:隐喻是武术技术孕育、形成和发展的认知工具,展示人脑思维与肢体动作之间的有机联系,使人们通过思考这些形象可感的外在形式,达到对武术文化精神的深刻领悟;中原武术谚语,处处显现着隐喻思维的作用痕迹,有着自身突出的具象性、局部性、多样性、经验性隐喻特征。
在消费升级背景下,卷烟消费者的需求已呈现多元化趋势,影响其购买卷烟的因素越来越多.基于此,结合卷烟消费市场的特殊性,对昆明等12个城市的卷烟消费者结构特征进行调研.结果显示,卷烟消费者的平均烟龄为10.62年,一般在17岁到34岁开始吸烟,月均购烟支出占平均月收入的7.45%.同时从消费动机、购买能力、消费习惯、购买数量等方面探讨了卷烟消费者消费行为特征.通过对卷烟消费者的结构及其消费行为特征分析
常规超速减载控制下的双馈感应风力发电机组虽然可参与系统一次调频,但存在发电效益低、转速调节范围小等问题。为提高系统频率品质,增强电网稳定性,该文综合考虑源–荷功率随机波动对系统频率产生的影响,提出双馈感应风电机组一次频率平滑调节控制策略。根据风电场一次大风气象周期的风电功率波动历史数据,研究单台风电机组在不同时间尺度下风电功率波动对系统频率产生的影响,确定了最佳时间尺度下一次频率平滑调节所需储能装
文章通过对我国科创板首例“同股不同权”优刻得公司的分析,分析其双层股权结构在实际中的发挥出来的优势和存在的问题,进而对整个科创板双层股权结构制度进行探究,结合我国现阶段的资本市场发展阶段,分析利弊,提出完善办法,让双层股权结构融合资本市场服务实体经济。
<正>为什么我国公司董事会里的斗争频繁发生?根本原因在于我国对董事会存在的一些错误观念和误区,包括控股股东必须控制董事会、董事长必须来自大股东且是公司“一把手”等,这些观念其实是对公司治理本质的误解一家国有控股混合所有制公司中,根据其公司章程,各方股东分别派出董事长、总经理、副总经理、财务总监等,参与公司决策和经营管理,
期刊
在如今的大数据时代,消费者面对的信息资源越来越丰富,并且在做决定时也变得更加精明,因此,广告的说服力愈加体现出其重要性。在提升广告说服力方面,企业必须要站在消费者的需求角度,更全面的考虑目标个体的特征,实现广告特征与消费者特征相匹配。现有许多研究探究了广告诉求的有效性,考虑的因素包括产品类型、年龄、文化、刻板印象等,也有些学者从消费者心理角度出发,探究了消费者动机和个体调节聚焦等的影响。然而现有的
目的 分析血管性痴呆患者认知功能障碍严重程度与H型高血压和血尿酸水平的相关性。方法 本研究纳入2018年6月-2020年6月就诊于海安市人民医院神经内科的血管性痴呆患者400例及体检中心的认知功能正常对象400人。分析血管性痴呆患者和认知功能正常对象的H型高血压检出率、同型半胱氨酸(Hcy)水平以及血尿酸水平的差异。按照认知功能评分将血管性痴呆患者分为轻度痴呆组(n=140)、中度痴呆组(n=14