面向慕课视频的关键词抽取研究与应用

被引量 : 1次 | 上传用户:shaw1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术和移动通讯技术的飞速发展,“慕课”(Massive Open Online Course,MOOC)在世界范围内迅速兴起,现有慕课平台上提供了海量的教学视频,但这些平台大多无法根据知识点进行精准视频检索。如何帮助学习者在海量的慕课资源中快速准确地查找具体的知识点,满足其个性化的学习需求,提高其学习效率是本文要解决的核心问题。鉴于教学视频的知识点通常也是视频讲授内容的关键词,因此,解决这一问题的关键是针对教学视频依据讲授内容实现关键词自动抽取。虽然,目前已有不少针对文本的关键词抽取算法,但尚未有针对口语化程度高、知识点具有层次性等特点的教学视频的关键词抽取研究。因此,亟需提出一种面向慕课视频关键词自动抽取的方法,为此,本文主要进行了以下工作:(1)分析并总结了慕课视频的语言特征,构建了慕课关键词抽取测试数据集并进行数据预处理。由于目前尚未有针对教学视频的标准数据集,本文运用视频爬虫和视频语音文字转写等综合方法构建了慕课测试数据集。并针对慕课视频的语言特征,提出从中文分词和文本过滤等方面对数据集进行文本预处理,以确保关键词抽取的准确性,最终得到关键词抽取候选文档集。(2)基于经典的TextRank算法和慕课视频的语言特征,提出了一种多特征融合的TextRank慕课视频关键词抽取算法。首先,根据慕课视频的语言特征,对关键词抽取候选文档集进行特征提取,得到影响词语重要性的特征:词语位置、词性和领域特征等;其次,提出通过序关系法确定文本中词语位置、词性和领域特征的权重分配;再次,将计算得到的词语综合权重用以确定传统TextRank模型中的词汇节点初始权值及概率转移矩阵,获得改进的TextRank算法;最后,通过算法的迭代,计算每个词语的最终权值,并据此选出权值最大的若干词语作为关键词。为验证算法的性能,在慕课测试数据集上进行仿真实验,实验结果表明所提出的算法是可行且有效的。(3)基于多特征融合的TextRank慕课视频关键词抽取方案,设计并实现了慕课视频关键词抽取系统。该系统具有界面简洁、操作简便、设计人性化与可拓展性强等优势,能批量处理数据、仿真关键词抽取算法和计算评价指标等,具有良好的工程实用性。本文的研究表明,面向慕课视频的关键词抽取有助于学习者在海量的慕课视频中快速准确地查找具体的知识点,能满足其个性化学习的需求,从而有效地提高学习效率。本文提出的慕课视频关键词自动抽取算法,有望在慕课检索系统中广泛应用。
其他文献
双主体资源共享课程构建模式,以教师主导制定教学内容和制作课程资源;学生主动自主学习、自行复习、自发参与课程建设;师生双向互动、在线交流答疑辅导为核心;通过"互联网+"
为了介绍彩虹系列无人机在试飞安全管控方面的经验,文中从试飞标准化流程建立、飞行试验安全技术设计、飞行试验安全管理体系建立等方面,详细阐述了彩虹无人机的试飞管控措施
<正>"听说泰囧可逗了,你特想看吧?""你家普通LED电视画面拖尾吧!看不清楚漂亮的人妖吧!""我家早都用U-LED电视啦!画质超高清,哈哈哈哈。"日前网络上疯传电影《泰囧》里王宝强
<正>2014年以来,国内多地迎来公交的"换车潮",在一系列政府政策的支持下,各个城市推广新能源公交车的力度逐渐增加。为进一步加快新能源汽车的推广应用,国务院办公厅下发了《
利用高温高压技术制备了Bi0.95La0.05Fe1-xCoxO3(x=0,0.1,0.2)陶瓷样品。研究了La和Co共掺杂对BiFeO3的物相结构及多铁性能的影响。结构分析表明,所有样品均为菱方钙钛矿结构,
目的探讨As-miR-21抑制Tb3.1人舌癌细胞系增殖能力的效果和机制。方法Oligofectamine介导转染反义寡聚核苷酸(AS-miR-21)下调Tb3.1人舌癌细胞系miR-21的表达。使用Real-time
<正>作为卷烟企业的原料,烟叶由于其价格高、用量大、生产和储存周期长等因素,在生产经营中占用大量资金,对一个企业的经济运行质量影响较大。因此,以市场为导向,规范采购程
会议
针对传统D-S证据理论对燃气轮机进行振动故障诊断时会出现一些悖论问题,提出D-S理论改进算法。首先,对采集的燃机振动信号分别从时域和频域进行特征提取,再利用三种不同类型
<正>广告目标借助山东卫视《花漾梦工厂》第二季的强势开播,全方位深度展现海信ULED超画质电视的传播诉求,提升其在重点市场的品牌影响力。策略亮点海信集团锁定山东卫视这一