面向微博短文本的社交与概念化语义扩展搜索方法

来源 :计算机研究与发展 | 被引量 : 0次 | 上传用户:crazyliang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
充分挖掘微博短文本的语义以实现精准搜索是一项重要任务.由于微博文本内容具有稀疏性和语义局限性的特点,使得仅通过分析字面语义来进行短文本理解和相似性匹配的传统搜索方法受到了一定的限制.因此提出了一种社交与概念化语义结合的扩展搜索方法,通过挖掘社交网络独特的社交属性如#标签#、"@"和链接信息URL,对微博短文本实现进一步的社交语义扩展.该方法将文本字面分析获取的概念词语和社交关系中潜在的关联标签信息相结合,对短文本进行2种角度下的语义特征表示,实现了基于微博短文本语义充分理解的精准搜索.在微博数据集上的对比实验表明,与已有的扩展搜索方法相比所提方法能捕捉更多的语义特征,微博搜索的性能也得到了显著的提升.
其他文献
本文旨在分析护患沟通不当的原因,以制定相应的防范措施,减少护患纠纷的发生。现报告如下。
“师道尊严”的表述最早约见于《礼记·学记》:凡学之道,严师为难。师严然后道尊,道尊然后民之敬学。$$在中国的教师理论和传统思想中,对师道的追求是最为本质和关键的。孔子讲“
报纸
支原体肺炎是一种非点型肺炎,是学龄儿童及青年常见的一种肺炎。肺炎支原体主要通过飞沫传播,全年均有发病,近年发病率升高,病程长,表现多种多样,个别病例呈暴发型肺炎,来势凶猛,危及
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield