融合BERT-WWM和注意力机制的茶叶知识图谱构建研究

来源 :西南农业学报 | 被引量 : 0次 | 上传用户:xiaoxiao_666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
【目的】针对当前茶叶领域语料数据库不完善、多源异构数据聚合能力差、知识共享困难等问题,提出一种基于BERT-WWM-BiLSTM-AttTea-CRF模型的茶叶知识图谱构建方法。【方法】以基于全词掩码的BERT-WWM(Whole Word Masking)层替换预训练模型中的随机掩码BERT层,并根据茶叶领域语料数据的全局文本特征,设计可实现茶叶关键实体权重分配的注意力机制层以提高文本提取的准确率,最后通过条件随机场对序列中的各个实体进行分类提取, 从而完成茶叶中文实体识别的整个流程。【结果】BERT-WWM-BiLSTM-AttTea-CRF模型能有效识别茶叶知识文本数据中的实体,对茶叶非结构化数据的实体抽取效果优于RoBERTa_BiLSTM_CRF、ALBERT_BiLSTM_CRF等主流模型,识别的准确率、召回率、F1值分别为92.03%、90.36%、91.19%。经改进后的模型对茶叶品种数据和茶叶病害数据的识别率有明显提升,其F1值分别达到94.32%和94.05%。【结论】该研究所构建的茶叶知识图谱具有数据覆盖面广、聚合能力强、体系完整等优势,对农业特定领域的知识图谱构建和农业中文命名实体的提取研究具有重要意义。
其他文献
山西八大套主要流传于山西省五台、定襄、原平等地,是国家级非物质文化遗产,与西安鼓乐、北京智化寺音乐齐名,由八部大型套曲组成,108个曲目,除去重奏部分,净57个曲牌。它是中国古代音乐史中现存最完整的大型套曲。本文通过对《青天歌》套当中的[青天歌]一曲的多个版本进行分析,来研究和分析其流变过程。
受新冠疫情影响,我国居民消费需求出现明显疲软现象,因而提振内需、激活消费市场是当前经济发展的重要方向。为此,政府应当助力物流业发展,从而为居民和企业提供更优质的流通服务,以此激活消费市场。本文以人均消费总量表示消费市场的激活程度,通过实证分析物流业发展对居民人均消费总量的影响机制,评估物流业发展对消费市场的激活作用,从而为政府制定物流业发展政策、激活消费市场提供参考依据。结果表明:在整体上,居民人
报纸
学位
社交媒体对人们的生活方式产生了重大影响。高中生处于心理发展的关键期,不恰当的社交媒体使用行为可能是导致学业成就产生问题的一个风险因素。对于社交媒体使用和学业成就之间是否还存在中介以及如何中介的问题,相关的研究尚较为缺乏,为了了解高中生的移动社交媒体使用情况,分析高中生问题性移动社交媒体使用行为及学业拖延、睡眠质量和学业成就的关系,本研究提出相关假设并加以验证。本研究采用方便取样的方法,抽取山东省某
<正>四川通江县地处秦巴连片贫困地区的核心区域,既是革命老区,又是国家新阶段扶贫开发工作重点县。全县幅员4119平方公里,在乡镇行政区划调整前,辖49个乡镇、524个村,其中贫困村157个、贫困人口11万余人,贫困发生率17.4%。党的十八大以来,通江县深入贯彻中央和省脱贫攻坚决策部署,聚焦“两不愁、三保障”,利用土地整治政策红利,探索实践形成以“项目叠加、市场推动”为主要特点的土地政策助推脱贫攻
期刊