论文部分内容阅读
互联网的出现和科技的进步促使科技项目的申报数明显提高,项目的评审工作显得至关重要,项目评审往往需要从众多的专家中选出相关领域的具有权威的专家对项目进行评阅和审查工作。传统的方法是由管理人员从专家库中进行推荐,存在耗时、浪费人力甚至因为对研究领域的划分不熟悉导致的分配不公平的问题,因此项目评审专家推荐方法的研究是非常必要的。评审专家推荐的核心思想是利用项目描述文档和专家信息描述文档,以及专家历史评审等信息进行项目和专家的匹配,利用文本挖掘和推荐算法的结合有效的进行评审专家的推荐。本文主要围绕项目和专家的向量表示模型、相似性比较方法、推荐算法等关键问题进行了研究,提出了一种基于文本挖掘的项目评审专家推荐方法。该方法主要通过对项目和专家根据其数据特征和重要程度进行分类,利用word2vec和LDA的文本挖掘算法进行项目和专家的模型构建,通过实验确认了模型训练的最佳参数,专家和项目的相似性度量使用本文中提出的基于权重分配的相似性度量方法,根据两类信息对整体信息的贡献度不同,赋予word2vec和LDA的相似性计算结果不同的权重,通过实验确认了最优权重分配比例。本文提出的推荐算法首先利用限制性条件对专家进行筛选,缩小待选专家的范围,加快算法计算效率;然后通过加权相似性比较方法采用基于内容的推荐方法进行推荐,使用专家模型和项目模型进行相似性比较,其中专家模型包括历史评审项目和专家信息,得到初始专家推荐结果;最后建立专家评分模型调整推荐列表,得到最终的推荐结果。基于文本挖掘技术本文提出一种专家评审推荐方法,为了验证该方法是合理且有效的,设计了一组对比实验进行验证,两组对比方法和本文的方法在相同的数据集上进行专家推荐。实验结果表明,在相同的实验条件下,本文的方法在F1值指标上明显高于其他推荐方法,说明本文提出的专家评审推荐方法可以有效的解决项目评审过程中专家推荐的问题,提高了推荐结果的准确性。