论文部分内容阅读
当今,计算机技术已成为推动社会发展与进步的生力军。自然语言处理技术作为计算机技术的一个大的分支,在半个世纪以来取得了迅猛发展,计算机辅助人工评阅作文已成为可能,对此,实验室设计完成了一个初步的写作批阅平台——PFWR,针对写作批阅平台后期的发展与普及,PFWR将会具有海量的作文库,造成信息过载,仅仅依靠学习者自身从作文库中选取优秀范文进行学习,必然其用户体验很差,并且由于信息量大,学习者很难准确的得到自己所想得到的优秀范文,为此,平台应该具有主动向学习者推送优秀范文供其学习的功能。而个性化推荐正是通过主动地向用户推荐准确的信息来解决上述信息过载所带来的问题,本文尝试在这方面进行研究和探索。
本论文主要工作和重点研究的问题包括:
1)提出基于对象用户相似性的协同过滤算法——通过相似对象传递的方法来缓解数据的稀疏性,削弱对象热门程度所带来的影响,并在传统推荐算法的计算公式中,通过引入评分修正项(ModRate)、不同用户对同一对象的评分差异项以及待推荐的对象与用户之间的相近程度项等,尝试使推荐优秀范文的质量得到较大的提高。
2)提出基于词频主题模型和结构的作文推荐算法——首次将主题模型引入推荐系统中,结合词频权重向量空间与主题模型精确计算出内容上相似的作文列表,在此基础上,计算作文结构向量,进一步重新排序作文列表,得出新的推荐结果。
本文实现的推荐模块弥补了PFWR类似平台在个性化推荐方面的空白,首次将个性化推荐模块在写作批阅平台上进行了实现,它以传统的个性化推荐算法为基础得出了新的算法,在数据稀疏问题和推荐准确度上都得到了很好的完善;而且本文利用了PFWR最大的特点——处理的作文对象是文本类型,通过将主题模型引入推荐系统以及将作文的结构作为筛选推荐结果的一种新的策略,这些都很成功的得到了实现和验证。