基于TFIDF的社区问答系统问句相似度改进算法

来源 :北京理工大学学报 | 被引量 : 0次 | 上传用户:Lassie01
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对社区问答系统问句相似度计算问题,提出了一种改进的TFIDF算法.按照用户的查询意图对问句进行分类,根据特征词在类别中的分布对权值进行调整;将问句的主题词归入特征项进行TFIDF计算.实验结果表明,本文改进的TFIDF算法的P@3比传统的TFIDF算法提高了7.66%,比TFIDF-IG算法提高了5.31%,而且P@5和P@10也有不同程度的提高,与传统TFIDF算法和参考改进算法相比,该算法明显提高了检索性能.
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
在对汽车座椅固件进行机械手焊接的过程当中,需要充分利用工装夹具技术来对其进行支撑和夹紧,这样能够有效的保证焊接质量和效率。并且在对工装夹具技术进行应用的过程当中,
目的探讨宫颈刮片细胞病理学检验在宫颈癌筛查中的临床应用价值。方法从我院社康妇科门诊2013年3月至2015年9月收治的2000例体检妇女分别进行宫颈刮片细胞学检验,并将检验结
在对经典算例研究的基础上,引入一种工程约束技术来改善多工况和动态连续体结构拓扑优化结果的合理性,该方法是在半径过滤法的基础上增加工程约束条件.数值结果表明,利用工程
南京绿博园有着相对完善的标识系统,可分为公园全景导览标识、公园区域导览标识、公园景点景物标识、公园道路交通指示标识等。目前公园标识系统在全面性、系统性、协调性、