论文部分内容阅读
随着我国法治进程不断推进,民众法律意识逐步提升,基层司法机构与法律从业人员的工作量达到了前所未有的高度。法律内容问答涉及广大基层群众的生活,具有普适意义。但由于法律咨询专业性较强,并且价格不菲,普通民众很难享受到高质量的法律问答咨询服务。法律咨询的群众需求量大、人力成本高。因此,研发自动化法律问答模型具有极强的应用价值与现实意义。法律问答面临的难点为专业性强、数据量少。法律行业由法律法规、判决文书等书面文件进行规范,代表了行业统一的逻辑标准和实践原则。然而当前的法律问答系统多采用关键词模型或简单深度模型,忽视了行业知识。引入法律知识图谱能增强问答过程中的法律专业性。同时,法律问答相比开放领域具有真实数据少、标注成本高的特点,深度模型在少样本条件下面临着训练难、效果差的问题。使用迁移学习能够使模型快速训练并达到良好效果。因此,本文基于法律知识图谱,结合迁移学习,对法律问答进行研究,主要研究内容包括:1.提出基于知识图谱的法律行业问答模型:针对问答模型对法律专业知识利用不足的问题,构建了基于案由与案情要素的法律知识图谱,表达法律行业的逻辑知识,在模型中通过注意力机制将法律知识图谱上的案情要素关系引入到问答过程。为了进一步提高模型针对问答语句的特征提取能力,增加了问答语句的双向注意力交互机制与多粒度特征提取机制。2.提出基于迁移学习的少样本法律问答模型:针对法律问答数据量较少的现状,提出了基于迁移学习的少样本法律问答模型。模型在富样本通用问答数据集上进行预训练,再通过模型迁移、参数共享,在少样本法律问答数据集上进行精调。3.研发线上法律问答系统:基于市面上缺乏智能法律咨询系统的现状,将前述模型进行了算法整合,集成了线上问答系统。该系统首次将基于知识图谱的深度学习答案选择模型应用于中文法律问答,并将中间结果进行可视化,达到了较好的问答效果。