基于改进的主题分割模型在教师话语文本分析中的应用研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:liuyc077
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
课堂话语作为课堂教学的重要媒介和主要手段,也是判断教师自身专业素质、教学理念和教学效果的重要指标之一。采用图式化和量化的方法对课堂教学话语内容进行结构化、系统化地剖析,能够科学并且客观地呈现课堂教学的内在层次逻辑,从微观角度分析课堂教学的结构。现阶段的教学话语分析大多采用人工观察、访谈、问卷调查等费时费力的方法,如何改善传统教学分析方法,辅助教育工作者高效掌握和分析教师授课特征是亟需解决的问题。针对目前该领域内缺乏中文教育文本的智能化分析方法的问题,本文提出了一种基于改进的主题分割模型的教师话语分析方法,利用该模型对教师话语文本进行主题分割,并且对各子主题段落进行内容结构分析及可视化呈现。实验结果表明,该方法在面向授课话语文本的主题分割任务中相较于其他传统方法更具有效性,并且实现了课堂话语文本主题分割及结构分析的智能化处理,可以有效应用于课堂教学文本的分析任务中。在本文面向课堂话语文本分析的技术研究中,主要包含以下三个方面的研究内容:首先,鉴于传统的LDA主题模型对于词语相关性的表达不够准确的问题,本文提出利用word2vec词嵌入模型获取词语上下文信息,将全局的主题分布特征和局部上下文语义特征进行融合,进一步明确语料之间的隐含语义关系。利用得到的主题分布和语义信息,对文档中各文本单元进行相似性度量,通过局部最小值的边界识别策略筛选出最佳主题分割边界,实现文本的语义段落划分。在语文课堂话语文本上的实验结果表明,该方法对比其他无监督主题分割模型具有更加出色的效果。其次,为了进一步挖掘出各子主题下教师话语内容的主题结构关系,本文提出利用基于滞后序列分析法的主题词结构关系可视化技术。该方法利用TFIDF词权算法对文档进行主题词抽取,统计主题词的位置分布序列,通过该特征序列对主题词进行滞后序列分析,从而获得转换概率矩阵,利用可视化技术将数学信息转变为逻辑清晰的教学内容结构图,为教育工作者进行教学质量分析提供一个新的视角。最后,为了有效验证及应用本文提出的教师话语分析方法,本文还构建了针对教学话语文本分割的语料库。对实录课程视频进行人工转录和标注,同时利用百度百科义项、网络优质说课稿语料,对这些数据进行了筛选和部分标注,为教师话语分析的具体实践和检验提供数据支持。
其他文献
近年来,我国随着城市化和工业化进程的加快,推动了社会的快速发展,导致整个社会结构高度复杂,突发事件发生的频率和规模都在逐渐加大,一般性的突发事件演变为具有高危害性和
音乐是现代人生活不可或缺的一部分,作品使用需求巨大。音乐领域的著作权收入也在全球著作权收入中占比最高。网络环境下,传播技术不断发展,促使音乐传播效率飞速增长,这对著
天线作为无线通信系统的信号收发部分,既是系统工作的始端,也是系统的终端。通信技术的快速发展对天线的性能也提出了更高的要求。除了要实现工作频带内稳定增益和方向图,易
商品更换包装销售行为不仅仅涉及到外观、样式的改变,同时也可能会影响到商品本身的质量。未经商标权人同意,在新包装上使用原商标的行为可能会引起商标侵权纠纷,我国的相关
在使用传统的参数型的退化模型对工业产品进行可靠性评估时,需要人为地指定均值函数的参数形式.但人们无法保证选择的参数形式与实际相符,所以不依赖参数形式假设的半参数退
在推进教育信息化的进程中,逐渐显现出数字教育资源过载的情况,致使资源使用者处于“信息”迷航的状态,无法快速找到满足自身需求的资源,大部分优质资源也因使用率不高而被埋
本文是以北京市第八中学附属小学的三年级《顽皮的杜鹃》、《春》和台北市万华区万大国民小学四年级《小牛不见了》、《胡桃钳》四首作品的课堂教学为观察对象,经过分析与思
密度函数估计是概率极限理论研究的重要方向之一,也是很多统计理论研究的基础。在非参数估计方法中,核估计方法由于其有效性和形式简洁而被广泛地使用,有大量学者将核密度估
布尔网络是研究基因调控网络的一种重要模型,它能较好地模拟基因之间相互作用的动态行为.因此,布尔网络动态特征的研究很快受到了国内外学者的关注.近几年,布尔网络在探索生
“高师改大”运动即指20世纪二三十年代在我国掀起的一场旨在将高等师范学校通过改组、合并或升格的形式转型为师范大学或综合大学的运动。这是一场深受国外师范教育思想变革