论文部分内容阅读
随着教育技术的发展,多媒体教学越来越多地被应用到中小学课堂中。科学纪录片一直都是受中小学教师所青睐的教育素材。它不仅可以帮助教师教授课本上的概念,还能给同学们留下深刻的印象,有助于提高同学们的学习兴趣。但在备课时,除了教科书配套的光盘外,教师很难找到其它的高清视频资料。这种备课需要的视频资料有两个要求:1.时间短,约为3-5分钟;2.包含教科书中出现的知识点。科学纪录片是一种被忽略的高清视频资料库。它之所以被忽略,是因为其时间长(大约45-90分钟)、同一部片子中包含多个不同的主题、纪录片语义与教材描述不一致等问题,导致教师很难从中快速的找出所需内容。针对以上问题,本文对如何在分割视频的同时更好地填补字幕文件与教科书之间的语义鸿沟,进而帮助教师在大量科学纪录片中迅速找到可用于教学的简短素材等问题进行了研究,设计了 ASTROS模型。ASTROS包含三个主要组成部分:1.知识图谱提取;2.纪录片字幕标注;3.重排序。为了备课教学的严谨,模型依赖的知识框架必须完全取自教材。因此知识图谱提取模块从教科书与教师用书中提取知识图谱,并为不同级别的概念分配不同的权重,为接下来的工作奠定基础。字幕标注模块使用深度神经网络LSTM,标注分类纪录片中的字幕,同时关联到知识图谱。重排序模块将根据不同的需求对检索中的多个匹配项进行重新排序。本文的创新之处在于:(1)通过深度神经网络标注字幕,将字幕语句关联到知识图谱,实现纪录片与教科书之间的语义关联,神经网络分类的准确率达到96%;(2)改进Lucene重排序算法,在查找分词匹配项的原理上加入上位词关联规则,使与检索关键字语义相关的匹配项得以出现在检索结果中,同时更加适用于教育类短文本搜索,搜索结果的nDCG得分均值达到0.89;(3)通过分割字幕的形式分割纪录片,便于教师快速获得知识点在纪录片中的实例。综上所述,文本提出的ASTROS模型依据教科书的内容建立知识图谱,根据知识图谱里的节点作为标签,建立深度神经网络将字幕语句逐条分类。改进的重排序算法使检索结果中可以出现与关键字有上位词关联的匹配项。实验初步结果表明,它可以提升教师的备课效率。