论文部分内容阅读
在项目评审过程中,往往需要根据项目的内容以及特点挑选出相关领域的专家,来对项目进行评阅和审查。传统的人工选择评审专家存在耗时、费力以及影响公平性等弊端,因此,自动地为申报项目推荐合适的评审专家是非常必要的。自动地为项目推荐评审专家是根据丰富的专家库信息,利用数据挖掘、机器学习等技术找到与项目相匹配的专家。项目主题模型是对项目的内容信息进行表征,项目主题模型的构建为后续评审专家的推荐提供支撑作用;项目文档的内容信息易于表征,有效地利用项目的内容信息可以提高评审专家的推荐效果;此外对已评审的历史项目信息进行挖掘,历史项目信息对评审专家的推荐有着重要的作用。本文围绕项目主题模型构建、基于内容过滤的评审专家推荐、基于协同过滤的评审专家推荐等关键问题开展研究,主要完成了以下研究工作:(1)提出了一种基于半监督图聚类的项目主题模型构建方法。该方法首先分析项目文档结构特点,提取项目名称、项目关键字等能表征项目主题的结构化信息,结合专家证据文档、专家关系网等能表征专家主题的外部资源,定义及提取项目文档片段之间的关联关系特征,然后,利用期望最大化算法确定不同类型关联关系的权重,计算项目文档片段之间的相关性,构建项目文档片段间无向图模型,最后,利用已标记关联关系特征作为聚类的监督信息,采用半监督图聚类算法对项目文档片段进行聚类,获得项目主题词,为后续评审专家的推荐奠定基础。(2)提出了一种基于Markov网络的评审专家推荐方法。该方法首先利用主题之间的相关性以及专家之间的关联关系分别构造主题Markov网络以及专家Markov网络,用于提取最大主题团和最大专家团,然后,结合这两个最大团信息,计算专家与项目之间的相关性,实现评审专家的推荐,最后,在五个领域数据集上的实验表明,利用主题(专家)之间的相关性可以提高评审专家的推荐效果。(3)提出了一种基于主题关系的评审专家协同推荐方法。该方法首先获取项目及专家的主题,构建项目(专家)之间主题关系网,然后,通过项目(专家)之间的主题关系发现与当前项目(专家)相似度最大的邻居集合,将该邻居集合融合到基于矩阵分解的协同过滤推荐算法中,最后对评分矩阵进行学习得到项目和专家的特征向量,预测评审专家的评分,实现评审专家推荐。实验表明,利用项目(专家)的主题关系能够更有效的预测评审专家的评分,提高评审专家的推荐效果。(4)设计并实现了项目评审专家推荐原型系统,为进一步研究评审专家的推荐方法提供了平台,为后续评审专家推荐方法的研究奠定基础。