论文部分内容阅读
知识图谱(Knowledge Graph)作为大数据时代的重要设施基础,已经在下一代搜索引擎、智能问答系统等智能应用中有了广泛应用。知识图谱规范地定义了知识的存储,并且可以较为方便和高效的进行知识推理和决策。面向特定领域的知识图谱应用研究也越来越多。当前,基于机器人领域的知识咨询热度持续升高,但配套的智能问答系统相关技术尚不成熟。本文立足于现实需要,深入研究探讨智能问答系统构建的核心技术,希望能为该系统的解决提供思路,加快系统实现进度,保证用户体验。本文的研究分为三个步骤,包括:(1)深入学习研究机器人领域相关知识语料,就实体与实体关系的抽取方式和实体属性的链接方法展开分析,基于此建立并完善知识语料组合构成的机器人知识图谱。(2)深入研究问句解析技术。第一,分析基于规则匹配和朴素贝叶斯的问句类型识别算法作为确定智能问答系统中问句类型的算法,确定其可行性;第二,使用TF-IDF关键词提取算法来提取问句中的关键信息,并使用余弦相似度算法进行问句的匹配;第三,借助Cypher查询技术构建查询语句模板,生成具有可执行性的Cypher查询语句。结合问句类型识别算法和问句匹配算法,该语句可自动检索图形数据库(Neo4j)中的信息以生成答案,最后经由检索到的结果输出答案。(3)根据上述确定的问答系统关键技术构建基于机器人领域的智能问答系统,并对系统和配套的算法展开测评,确保这些关键技术可推动智能问答系统的实现。