中文术语粒度对其区分能力测度的影响分析

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:foxi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的]比较中文术语粒度对不同字段的术语区分能力(Term Discriminative Capacity,TDC)测度的影响.[方法]将术语区分能力测度应用于题名、关键词、摘要和附加关键词的术语质量评估,在对照组和实验组中使用方差分析对不同学科、字段及术语粒度的TDC进行差异检测.[结果]当关键词和附加关键词未经处理时,在TDC上的表现为:题名>摘要>附加关键词>关键词;当术语粒度为词时,附加关键词的表现提升,题名>附加关键词>摘要>关键词.[局限]实验数据仅包含5个人文社会科学学科,样本代表性可能存在不足.[结论]中文术语粒度和字段在术语区分能力测度上相互作用,各字段的术语粒度统一为词可降低字段因素的影响.
其他文献
[目的]预测正在执行中的业务流程实例的剩余执行时间,为业务流程优化提供决策支持.[方法]提出一个业务流程实例剩余执行时间预测的深度迁移学习框架,该框架使用多层循环神经
[目的]研究患者选择医生时的决策机理,构建融合患者决策机理的医生推荐方法,提升医生推荐的效果.[方法]利用Word2Vec训练词向量模型计算患者与医生间基于文本的相似度,得到基
[目的]在线教育资源中存在大量未标注知识点的试题,探究对试题知识点进行自动标注.[方法]通过引入文本语义概念,考虑待标注试题与学习规则之间的语义匹配程度,提出一种基于语