结合作者兴趣与合作关系的主题模型与主题演化研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:Jiangzi1125
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如何在海量文本环境下提供有效的信息服务,已经成为国内外学术界与工业界关注和研究的重点问题。为了帮助人们从语义层面上快速理解文本内容,各种主题模型被相继提出。同时,文本之中各主题的变化趋势与内容演变过程也越来越受到人们的关注。学术论文作为科学研究发展过程中最重要的知识载体,其主题发现与主题演化分析对于研究人员了解学科研究方向、理清研究思路有着非常重要的意义。  论文在前人主题模型与主题演化相关研究的基础之上,针对学术论文的特点,着重探讨了结合作者兴趣的主题建模与基于作者合作关系的主题演化等问题。本文的主要工作包括以下三个方面:  (1)介绍了主题模型与主题演化研究现有的方法与现阶段所面临的问题,并对各方法的切入角度、模型建立以及求解算法进行了论述。为后续的研究与讨论提供了一个比较完善的理论框架。  (2)将作者信息纳入主题空间,提出了作者对于主题的兴趣这一概念,并给出了数学定义和计算方法。将作者兴趣以正则化项的形式融入主题模型,进行了模型的理论设计与近似求解。在ACM会议论文数据集和CiteSeer数据集上进行了实验,结果表明结合作者兴趣的主题模型能更好地描述文档主题。  (3)建立科研合作网络,将文档主题之间的演化置于合作网络之上,提出了结合科研合作关系的主题演化分析算法。基于(2)中提出的主题模型,对文档数据集进行主题抽取,再按时间段划分,利用作者的合作关系进行主题之间的转移概率计算。实验表明,本文所提出的方法能够较为准确地反映出主题的演化过程。
其他文献
随着大数据时代的到来,对大数据的挖掘、分析、可视化已经成为当今时代的迫切需求。数据可视化综合运用计算机图形学、图像处理、人机交互等技术,以图形图像的方式表现和传达数
面向移动终端的复杂三维场景实时交互技术是计算机图形学与虚拟现实的热点之一,但是现有的手段仍不能满足终端上复杂三维场景的高真实渲染的实时应用要求。为了解决手持终端上
社会化推荐系统随着社交网络平台的流行以及用户对社交媒体的重度参与,成为了社交平台中信息过滤的重要手段,广泛地应用于各样的社交平台及电子商务领域中,成为当前推荐系统研究
热点话题是在具体时间段内发生的,能够引起人们广泛关注的不同领域中的话题。微博热点话题是以微博为应用平台的热点话题。微博是以用户关系为基础进行信息分享和传播的平台,具
即时通信对互联网发展至关重要,应用很广泛,极大方便了人们的生活。基于P2P技术的即时通信系统成为研究的热点,传统的即时通信工具大多数协议标准不统一,难以定制和集成到开发者
准确的烧伤程度评估,是治疗烧伤患者过程中十分关键的一步。烧伤区域体表面积,是评价烧伤程度的主要依据。及时、准确的烧伤区域体表面积估测,是为病人提供正确输液量,以及确
传感器节点大多部署在环境较恶劣或者是敌对等地方,且没有身份验证中心,所以很容易被敌人捕获,从而可以看出无线传感器网络的安全问题是十分重要的。大多数已有的密钥管理方案不
无线传感器网络作为资源严重受限的网络系统,路由协议的设计对网络生命期等性能指标影响巨大。同时,由于传感器节点大部分能量消耗在数据传输过程中,如果在数据转发之前首先进行
目前,世界正处在经济全球化与信息技术高速发展的时代,汽车产业也随之爆发式增长,汽车正越来越成为大众消费品。与此同时,越来越多的交通阻塞、交通违规、交通事故等问题使得交通
信息技术的飞速发展使信息资源的过度膨胀和用户查询的多样化需求逐渐成为一种不可缓解的矛盾,各种信息检索技术应运而生。存在着更大研究价值和广泛应用前景的文本检索技术