基于博客的个性化文章推荐研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:mylook1028
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的发展,计算机网络深入到生活得各个方面,计算机网络上的应用纷繁多样。当互联网上拥有庞大的信息量与庞大的用户量的同时,信息与用户需求的匹配成为严峻的问题。庞大的信息量会使得用户获取特定信息的效率下降。个性化推荐的目标就是通过获取用户具体的需求,让每一位用户都能够高效地获取互联网上特定的信息。   要使用户信息获取更准确和高效,就需要解决用户兴趣描述不足的瓶颈问题。如何扩充用户兴趣的描述已成为信息检索的重要研究问题。现有工作主要包括相关反馈、隐式反馈与协同过滤。然而相关反馈不但干扰用户的使用,还存在第一步漏检的信息难以恢复的缺点;隐式反馈也有相关反馈中第一步漏检的信息在反馈后仍然难以恢复的缺陷,另外隐式反馈获得的信息往往有较大的噪音,影响系统的精度;协同过滤中,由于用户兴趣的描述本身很少,能用于判断两个用户兴趣相似程度的信息就很少,用这些很少的信息获取的相同兴趣用户组就会不准确。   随着web2.0的兴起,互联网从信息发布者与信息消费者分离的格局,转变为了信息发布者等于信息消费者的新格局,大量的用户开始在网络上发表日志、评论、图片、视频等信息。本文认为可以利用用户在互联网上发布的信息得到用户的发布兴趣,再来帮助用户在检索时对自己兴趣的描述。   本文主要工作在于提出通过使用用户的发布兴趣推测用户的获取兴趣,利用用户发布的信息来进行文章推荐的可行性进行研究。本文选择通过用户博客文章进行个性化推荐这个任务进行研究。首先,本文利用用户发表的博客文章,使用多种分类方法从一批博客文章中选取与用户需求相一致的文章,即进行个性化推荐,实验结果表明使用博客文章能够一定程度反映用户的兴趣所在。其次,本文尝试使用特征选择方法提高个性化推荐的准确度,实验表明可以通过特征选择提高推荐准确度。另外,本文还通过对博客文章与传统新闻文章推荐的对比实验,发现使用博客文章与使用传统新闻文章的不同之处,使用博客文章进行推荐的精度较低,且需要使用更多的特征,这些结果对未来利用博客文章辅助搜索的研究具有潜在意义。
其他文献
随着语义网与本体研究的开展,本体被广泛应用到各个领域之中,越来越多的本体被构建用以表示知识与共享知识。由于不同领域问题的不同特征以及网络分布的不集中性,不同领域构建的
随着虚拟化技术在云计算环境下的广泛应用,虚拟机系统的安全问题变得越来越突出。虚拟机系统装载企业用户的应用暴露在互联网环境下运行,很显然会遭受到来自网络环境中的各种攻
计算机安全的主要目标是保障信息的保密性、完整性和可用性。如今,计算机网络几乎延伸到了世界的各个角落。网络环境中Windows操作系统主机的非法外联问题是内网安全的重要问
本文是国家863计划重大项目“水稻精准作业技术集成与应用(2006AA10A307)”中联合收割机测产系统研究的部分内容。在水稻收获测产系统中,稻谷含水率是准确计算产量的一个重要
语言是人类交际中最重要的交流工具。人类的话语在包含文字符号信息的同时,还包含了丰富的说话人感情和情绪等信息。传统语音识别主要关注于对语意文字的识别,而通过对语音信号
在现今全球化时期,人们对翻译的需求越来越大,机器翻译技术飞速发展。如何准确、快速地评价翻译系统性能,已成为影响机器翻译发展的一个关键因素,对机器翻译的研究有着非常重要的
互联网已从创建之初面向点到点通信的网络,发展成一个为全球各行各业提供高效海量信息传输和其它信息服务的庞大网络体系,在整个社会经济生活中起着至关重要的作用。不断出现的
当前,分布式共享与协同技术在汇集和共享地理上分布的空间数据资源,并对其进行一体化组织、存储、管理、访问等方面发挥着越来越重要的作用。在分布式环境中,数据和查询请求在时
业务是通信网络发展的驱动力,随着网络与通信技术的迅猛发展,VoIP(Voice over Internet Protocol,互联网协议电话)单纯的语音业务已经不能满足人们的通信需要。开发更多的业
随着通信技术的不断发展和社会需求的增大,软件定义无线电(Software DefinedRadio,SDR)技术这几年迅速发展,它打破了设备的通信功能的实现仅仅依赖于硬件发展的格局,让设备适用于