【摘 要】
:
随着微博的日趋流行,它已经成为市场营销情报工作和名誉管理等行业的重要信息来源Twitter等微博网站日渐成为海量数据信息的发布平台,对微博的研究逐渐从挖掘单一的用户关系向
论文部分内容阅读
随着微博的日趋流行,它已经成为市场营销情报工作和名誉管理等行业的重要信息来源Twitter等微博网站日渐成为海量数据信息的发布平台,对微博的研究逐渐从挖掘单一的用户关系向挖掘微博自身的内容进行转变由于微博用语具有随意性创造性以及长度受限等特点,机器通过语义分析来智能的理解微博内容的真实含义至今仍然具有很大的挑战现有的微博文本概念扩展方法较少已有方法大都需要提取非常多的文本特征且仅考虑到局部词语之间的关系由于微博概念扩展的核心是判断概念词与微博本身关系的紧密程度,因此本文从微博整体出发,将微博中的所有关键词语看作一个整体,从而将微博中所有关键词语组成的语义近似于微博本身的语义本文的主要工作如下:1.为了更好地理解微博中的信息,我们提出了一种基于维基百科的概念扩展方法来为微博内容增加语义该方法首先在维基百科中自动识别出与微博语义相关的概念,然后对这些增加的概念做进一步的数据挖掘,以减少人工检查和筛选的劳动量具体来说,该方法采用了消歧模型计算维基百科中概念之间的语义相似度,然后基于得到的语义关系为微博增加相关的维基百科概念通过实验对该方法进行了测试,并同基于互信息的方法作了比较实验结果表明本文提出的基于词义消歧的方法是可行且有效的2.本文通过充分利用维基百科中的类别网和内部链接所包含的语义信息来计算概念与概念之间的语义,从而降低了噪音对词义消歧模型的影响通过实验验证了本文提出的基于类别网的方法和基于内部链接的方法实验结果表明,这两种方法都极大的提高了微博概念扩展的准确率和召回率
其他文献
世界在发展,科技在进步,第三代无线通信已经大踏步向第四代通信迈进,手机等基本通信工具的用户数量已经非常庞大。随着数据流量业务与多媒体通信服务的兴起,适应需要的第四代移动
语音情感信息在人们日常生活和工作交流中起着重要作用。语音情感的分析和识别作为人机接口智能化的重要指标,是实现人工智能的关键问题之一,已经得到越来越多的学者关注,而且在
当前,国内设计院校开始重视用户研究教育,并相继开设相应的用户研究课程。但国内设计院校的用户研究教育尚处于起步阶段,课程的开设不够全面,教学的方法不够科学。本文试图通
简述了油气长输管道泄漏的原因和危害;回顾了国内外油气长输管道泄漏检测技术发展的历史;详细介绍了热红外线成像、探地雷达、气体成像、传感器法、探测球法、半渗透检测管检
[目的]利用比较基因组学方法,对药用模式真菌灵芝的基因组中的小G蛋白基因家族成员进行系统的预测分析和比较.[方法]利用真菌物种中已经报道的小G蛋白,对灵芝全基因组进行BLA
由于当代手机、平板电脑等移动智能设备有着良好的移动性、交互性以及便携性,移动浪潮开始在人类社会普及并发展,且对人类受众产生了深而远的影响。HTML5依托于大数据可以对
<正> 研究工作是不会有尽头的,但写了十篇摘要之后,似乎该有一个较系统的概括小结了,目的是使看过的人知道来龙去脉及目前国际上的发展情况(当然把我们六十年代的工作和国外
<正>普教所建所35周年了,正处在"而立"到"不惑"的当口。我从教50年,从研40年,与普教所有一种难以割舍的鱼水之情,有很多话要说。结合我的亲身经历,从回望、观望、盼望这三方
随着我国经济发展越来越迅速,建筑工程也越来越多,因此施工技术的应用与优化管理也越来越重要。好的管理有利于提高建筑工程的施工质量,有效节约施工时间,更能降低施工成本。
天津著名文物收藏家徐世章先生于1954年将其集毕生心血收藏的珍贵文物与图书全部捐赠国家,为全民共享。本文仅就所捐赠的古籍善本书的总体情况及重点藏书作一介绍,以便人们对