基于词表和句法规则的社会化标签分类研究

来源 :情报资料工作 | 被引量 : 0次 | 上传用户:best0909
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文章在概念层面上将标签分为事实型、主观型和个人化3类,根据相关元数据构建词表,并根据标签在用户生成内容中的句法构成制定识别规则,结合二者将标签进行分类。以中国最大的电影标注系统豆瓣网675351位用户的标签数据为例进行实验,实验的召回率为95.01%、准确率为96.19%、F1-measure为95.32%,结果表明这种方法可以较好地实现标签自动分类工作。 The article divides the tags into three categories: factual, subjective and personal on the conceptual level, constructs the vocabulary according to the relevant metadata, formulates the recognition rules according to the syntactic structure of the tags in the user generated content, and combines the two to classify the tags . Taking the tag data of 675,351 users in China’s largest film annotation system, Douban, as an example, the experiment was conducted with the recall rate of 95.01%, the accuracy rate of 96.19% and the F1-measure of 95.32%. The results show that this method can be better Label automatic classification work.
其他文献
车辙是沥青路面主要的破坏形式之一。从沥青路面车辙破坏机理与抗车辙性能试验评价出发,从成因、形成过程与破坏类型具体分析车辙破坏的机理,汇总整理国内外使用较为广泛的沥
社会责任源自社会主体在社会关系体系中的特定社会地位,社会责任共担是一种社会发展趋势,有其重要的理论基础。养老是一种社会责任。宗教参与养老不仅顺应养老主体多元化发展
中国对外文化交流与传播的实践为中国跨文化传播学的发展创造了良好的契机,尤其为理论构建提供了实践的基础和现实的诉求。人是传播关系的总和,人的存在体现了交往的本质,交
数学作业是数学学习教与学的交叉点,数学作业评价作为数学教育教学的常态化工作,在教学中重要性是其他工作不可替代的。研究数学作业评价的文章是丰富的,本论文以学生作业当
本报阿拉善5月13日电 截至目前,阿拉善盟欣和科技有限公司已有4项科研成果获得国家专利。科技的迅速发展,使企业规模3年壮大了10倍。$$    阿拉善盟欣和科技有限公司是以
报纸
初中信息技术作品课是初中信息技术课的重要组成部分,信息技术作品课是指针对某一作品主题进行规划、设计、创作和评价,最终呈现出具有一定容量的作品。课上学生的作品不仅能
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield