论文部分内容阅读
课堂话语作为课堂教学的重要媒介和主要手段,也是判断教师自身专业素质、教学理念和教学效果的重要指标之一。采用图式化和量化的方法对课堂教学话语内容进行结构化、系统化地剖析,能够科学并且客观地呈现课堂教学的内在层次逻辑,从微观角度分析课堂教学的结构。现阶段的教学话语分析大多采用人工观察、访谈、问卷调查等费时费力的方法,如何改善传统教学分析方法,辅助教育工作者高效掌握和分析教师授课特征是亟需解决的问题。针对目前该领域内缺乏中文教育文本的智能化分析方法的问题,本文提出了一种基于改进的主题分割模型的教师话语分析方法,利用该模型对教师话语文本进行主题分割,并且对各子主题段落进行内容结构分析及可视化呈现。实验结果表明,该方法在面向授课话语文本的主题分割任务中相较于其他传统方法更具有效性,并且实现了课堂话语文本主题分割及结构分析的智能化处理,可以有效应用于课堂教学文本的分析任务中。在本文面向课堂话语文本分析的技术研究中,主要包含以下三个方面的研究内容:首先,鉴于传统的LDA主题模型对于词语相关性的表达不够准确的问题,本文提出利用word2vec词嵌入模型获取词语上下文信息,将全局的主题分布特征和局部上下文语义特征进行融合,进一步明确语料之间的隐含语义关系。利用得到的主题分布和语义信息,对文档中各文本单元进行相似性度量,通过局部最小值的边界识别策略筛选出最佳主题分割边界,实现文本的语义段落划分。在语文课堂话语文本上的实验结果表明,该方法对比其他无监督主题分割模型具有更加出色的效果。其次,为了进一步挖掘出各子主题下教师话语内容的主题结构关系,本文提出利用基于滞后序列分析法的主题词结构关系可视化技术。该方法利用TFIDF词权算法对文档进行主题词抽取,统计主题词的位置分布序列,通过该特征序列对主题词进行滞后序列分析,从而获得转换概率矩阵,利用可视化技术将数学信息转变为逻辑清晰的教学内容结构图,为教育工作者进行教学质量分析提供一个新的视角。最后,为了有效验证及应用本文提出的教师话语分析方法,本文还构建了针对教学话语文本分割的语料库。对实录课程视频进行人工转录和标注,同时利用百度百科义项、网络优质说课稿语料,对这些数据进行了筛选和部分标注,为教师话语分析的具体实践和检验提供数据支持。