【摘 要】
:
随着互联网的迅猛发展,在线视频学习成为了人们自主学习的重要途径。但是很多开放教学视频并没有提供课件的电子文档,这对学习者带来了极大的不便。为此,本文设计并实现了一
论文部分内容阅读
随着互联网的迅猛发展,在线视频学习成为了人们自主学习的重要途径。但是很多开放教学视频并没有提供课件的电子文档,这对学习者带来了极大的不便。为此,本文设计并实现了一个基于CNN的在线教学视频课件内容提取系统,该系统能够把视频中的课件页面转换成一个可编辑的电子文档,供使用者利用。本系统主要分为视频帧提取、页面对象分析、文本识别和文件生成四个模块。其中视频帧提取模块是从在线视频中截取屏幕图片并处理为课件页面;页面对象分析模块把获取的课件页面分割为不同的对象区域,并分类为图片、表格、公式和文本中的一种;文本识别模块使用开源的CRNN模型把文本区域图片识别为文本;文件生成模块按照课件原始的布局利用python-docx库生成一个可编辑的docx文档。页面对象分析模块的算法分为分割算法和分类算法。对于分割算法本文提出了基于模式匹配的投影RLSA算法,该算法首先对输入图片进行水平或垂直方向的投影,并对投影的二值化结果采用一维RLSA算法进行迭代地分析并判别分割点,得到了良好的分割效果。分类算法提出了一种双通路混合卷积网络,该网络分别训练一维和二维的Alex Net网络作为特征提取器,并采用一个三层双通路全连接层进行最终的分类。该网络在ICDAR2017 POD数据集中达到了98.02%的分类准确率,是基于深度网络方法中的最佳分类效果。对系统的实现而言,视频帧提取模块中对截屏图片利用对应像素相减和像素投影的方法进行重复帧检测、黑边去除、课件页面判别等处理。在页面对象分析模块中,采用客户端-服务器的架构,分类模型部署在服务器,客户端通过向服务器传送区域图片获得分类结果。在文本识别模块对文本区域进行基于投影的单词分割,以在单词间添加空格。在文本生成模块中设计了一系列排版信息参数,并以此恢复课件的原始布局。该系统对布局不复杂的浅色背景课件页面取得了不错的恢复效果,实现了完整的基于CNN的在线教学视频课件内容提取系统。
其他文献
黑磷是磷元素的同素异形体之一,具有原子级厚度的黑磷被称为黑磷烯(BP)。对BP的深入研究始于其在场效应晶体管中的成功应用,并迅速扩展到了光电转换器件、能源存储器件、传感器
近年来,随着中国制造业的蓬勃发展,如何有效提升企业竞争力已经成为制造企业亟待解决的问题。作为制造行业重要优化手段之一,柔性作业车间调度问题(FJSP)研究受到了广泛关注
目的:本研究通过对经微弧氧化表面含锌钛基内植物的特征进行研究,探究其在新西兰大白兔体内的抗菌活性及毒副作用,为内植物相关感染提供一种有效的解决途径。方法:制备经微弧
随着科技的发展以及计算机水平的提高,网络化控制系统在工业上得到了广泛的应用。在控制科学领域,网络化控制系统作为一种特殊的混杂动态系统,近几十年来一直是控制理论与工
聚(3,4-乙撑二氧噻吩)(PEDOT)是一种高分子聚合材料,在传感领域中表现出了优异的导电性能,超高的电子传输速率为传感提供了高灵敏度和低检测限基础。二维纳米过渡金属硫化物是一
目的:讨论比较腓骨偏心性固定与中心性固定两种固定方式对胫骨远期愈合率的影响,以期明确两种方法有何异同,更好的指导临床工作。方法:选取我院2015年7月至2017年10月55例胫腓骨骨折患者,按照腓骨治疗方式不同,分为A组(29例)、B组(26例)。2组胫骨骨折患者均采用髓内钉中心性固定,其中A组腓骨行髓内钉内固定术,B组腓骨行钢板内固定术。对2组患者的一般资料、手术时间、术中出血量、住院时间、胫骨
近年来云计算技术得到了飞速的发展,容器技术在其中扮演着重要的角色。然而在无服务器计算等场景下,容器部署和冷启动仍然是一个性能瓶颈。每当函数被调用时,容器就会启动,并且在处理完请求后会立即销毁。在无服务计算平台中,通常会使用高级语言,比如Python和JavaScript,高级语言需要更复杂的运行时,导致其启动速度比同等的C程序慢十几倍。这些技术使容器冷启动更加频繁和耗时。新兴的非易失内存因其优良的
在民用基础设施的检测中,视觉测量作为无损检测方法之一,相较于传统的接触式测量方法具有很多优点,但发展较为成熟的视觉方法大多需要依靠人造靶标,仍然具有局限性。提取结构
近年来,我国对于改性塑料产品的需求一直呈现稳步增长的趋势。广大的市场前景吸引了众多国际化工巨头加入其中,造成行业内部竞争日益激烈。当前改性塑料制品行业领域,产品质
光场相机仅需要一次拍摄就可以完成对场景多维信息的记录,在深度估计领域具有数据方面的优势。但是现有的基于深度学习的光场深度估计方法中,如何尽量减少计算量的同时又高效