论文部分内容阅读
在人工智能快速发展的时代背景下,智能化的自然语言处理技术取得了快速发展。实现高效、全面,更具有实用性的智能问答随之成为了自然语言智能化的重点研究方向。其中,作为重点应用领域之一,借助自然语言智能处理技术方面取得的研究成果,面向电商领域开发建设更具智能性和实用性的智能问答系统引起了国内外学者和产业界的高度关注。近年来,随着电子商务的快速发展,电子商务平台数量、用户数量快速增加,商品种类日益丰富、商品信息爆炸式增长,广大网购消费主体在进行商品选购时出现的“信息迷失”问题越发严重,进而导致消费者在不同电商平台之间进行商品比选时遇到了严重困难。一方面,从市场需求角度分析,受限于用户群体庞大、客服资源受限的制约,客户服务供需严重失衡,因此对于构建智能问答系统有着迫切需求;另一方面,从技术研发角度分析,不同于其他领域的问答系统,电商平台用户数量和商品内容的海量性,以及不同网购用户对于商品的关注点及认知的差异性,使得智能问答系统的构建具有更大的挑战性,其中很多问题还需要进行持续深入研究。基于上述背景,本文在总结、分析国内外相关领域主要研究成果的基础上,从网购用户评论分析的视角出发,开展了面向电商领域的智能问答系统构建关键技术研究。主要研究内容和研究成果如下:(1)在网购评论知识抽取方面,提出了一种基于MA-BiLSTM-CRF的网购评论命名实体识别方法并通过实验验证了其有效性。该方法首先以词向量和词性向量的组合作为BiLSTM的输入,利用BiLSTM提取网购评论文本的全局特征。然后,通过引入多头注意力机制在文本全局特征上提取最终的文本特征。最后,利用CRF识别出网购评论中蕴含的属性类和观点类知识。(2)在命名实体关系抽取方面,提出了一种基于CNN的实体关系抽取方法并通过实验验证了其有效性。该方法首先通过基于Wec-HC算法,对属性类实体进行聚类。然后,根据聚类结果对属性类实体进行替换。最后,通过CNN对属性类实体和观点类实体之间的匹配关系进行抽取。(3)在知识库构建方面,提出了一种基于知识图谱的智能问答系统知识库构建方法。为更好的表示和使用网购评论中的命名实体和实体关系,该方法首先通过整理抽取得到的实体和实体关系,然后将其导入到图数据Neo4j中,最后以知识图谱的表现形式进行智能问答系统知识库的构建。(4)在问答系统建模方面,设计了基于知识图谱的智能问答处理流程,提出了一种将用户问句文本中的实体与知识库中的实体准确链接的问句分析以及答案生成方法。该方法由问句分析模块和答案生成模块组成,首先问句分析模块利用实体识别技术和实体链接方法对问句进行语义解析,得到用户问句的语义信息。然后,在答案生成模块中把问句分析模块得到的语义信息转为知识图谱查询语言,通过在知识图谱内进行查询,得到问句的答案。最后,将语序处理后的问句答案反馈给提问用户。