以用户为中心的观点挖掘研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:zhennanquming
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的飞速发展,博客、社交网络、微博等平台的出现,使得人们在网络上发表个人观点变得更为方便快捷。如何从海量数据中提取出消费者、商家、政府等群体需要的信息,并对其进行分析、总结,从而形成有有针对性的、可读性强的分析结果,就变得尤为重要。而现阶段研究者们所进行的观点挖掘,绝大多数都忽略了观点的一个本质特性,即评论者的主观性。单纯地针对评论进行观点挖掘,而未能很好地考虑用户的行为,将影响挖掘结果的精确性。针对以上问题,本文通过引入用户的行为来对现有的观点挖掘技术进行改进。本文的研究成果主要体现在以下几个方面:(1)针对数值评论部分提出了基于HITS算法的改进挖掘算法;(2)针对文本评论部分采用了朴素贝叶斯分类法,将评论内容映射为分值形式;(3)将数值部分与文本部分评论相结合,剔除不相匹配的评论,从而为用户提供更高可信度的观点挖掘结果。对比实验表明,两种算法均取得了较好的效果,两部分评论的结合有效提高了挖掘结果的准确性。
其他文献
随着计算机技术与网络通信行业的迅猛发展,人们对高速运动状态下信息传递、获取需求越来越强烈。无论是无人机空中作战指挥,还是地面上移动车辆之间的协同等,都需要高速移动
随着计算机和通信技术的发展,个人及企业的电子文件数量也在不断地增长,这些文件中不乏一些需要个人和企业保密的重要文件。由于个人及企业员工安全意识或者防范能力较差,导
P2P技术的诞生给数据集成领域带来了强大的发展动力。传统的集中式数据集成系统具有系统性能依赖服务器这一系统短板,结合P2P和数据集成系统两者优势而诞生的P2P数据集成系统
随着互联网技术的不断发展和普及,信息技术为多媒体信息的收发和存取提供了极大的便利,也使信息之间的交流达到了从未有过的广度和深度。信息隐藏利用其伪装这一特点在信息安全
Web服务组合的目标是通过简单服务的组合形成以满足需求的新服务,这个目标的完成是通过相对简单的Web服务交互的设计。但Web服务组合的执行过程中,复杂的需求的互动往往涉及
学位
随着蒙古文信息处理技术的发展,研究内容越来越深入,如何保证文本的正确性,显得越来越重要。因此,校对的工作量也随之增大,对于飞速增长的电子文本,人工校对的方法已经无法满
随着近些年互联网的飞速发展,Internet已经发展成为一个庞大的发布和共享信息资源的平台。但是如何从海量、无结构或半结构化的数据中快速、高效地获取用户所需的信息仍然是亟
数据挖掘是指从数据库中发现隐含的、新颖的、对决策有潜在价值的知识和规则的过程,已经在许多领域得到了广泛的应用。聚类分析是数据挖掘领域最为重要的技术之一,在理论和方
粗糙集理论是波兰学者Pawlak提出的一种处理不确定知识的数学工具,该工具能够很好的对符号数据进行如属性约简、规则提取等分析,并在人工智能、机器学习与数据挖掘领域取得了成