基于Web数据的中小学网络教学资源建设现状调查

来源 :南京师范大学 | 被引量 : 1次 | 上传用户:axjlzpf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据技术为教育信息化带来了新的机遇,为研究者和管理者对教育中的诸多问题的研究提供了新的数据来源和方法。在海量的教育信息化数据中,教学资源作为一种承载着学习行为、学习活动、学习进程信息的教学数据,隐含着丰富的分析价值。网络的出现不仅改变了人们的生活方式而且传统的教学方式也正经历变化,借助网络的教学形式正如雨后春笋般涌现,教学资源的建设作为教学活动过程中尤为关键的一环越来越受到关注。在这样的背景下,调查教学资源建设现状是推进教育信息化有序向前发展的重要手段之一。本文从学科、地域和同质性三个方面调查建设现状,其主要研究工作内容如下:(1)针对中小学资源网站上非结构化数据设计了相应的采集和存储策略并为采集和处理大量数据建立了Hadoop分布式集群。通过二次开发网络爬虫Nutch将中小学资源网站数据不断采集到本地并存储在分布式数据库Hbase中,为后续网页分析、资源数据提取提供了高性能的数据吞吐平台。(2)依据中小学网络教学资源语言特点和网页结构提出了一种建立教学资源库的方法。教学资源数据是由标题、关键字、日期、正文内容等元数据描述,利用开源工具Jsoup抽取标题、关键字等,利用模式匹配算法抽取日期、媒体类型,利用行块分布函数抽取正文内容,最终依据网站-网页-链接间关系建立网络教学资源库。(3)中小学资源网站中的资源多以学科、地域分类展示,依据资源的链接结构和标题建立VSM模型,然后利用模式匹配和向量相似度技术分析模型中学科和地域属性。在资源同质性分析中,从三个层次界定了网络教学资源的同质性:同名的资源是初级的同质;其次是同名且同类型;第三个层次是正文相同。第三层次的研究中利用LDA模型,为教学资源正文建立一种主题模型,然后使用基于层次的聚类算法分析主题模型相似度。(4)为了解决大量数据计算问题,将网络教学资源抽取、VSM模型、LDA模型和聚类算法重新设计使其可以运行在MapReduce编程模型上,为整个调查奠定基础。实验结果发现语、数、外资源量占有的比例较大,且需要参加考试的科目比不需要的多:东部沿海和珠三角地区的资源分布量显著较高;网站资源重复建设的现象依然存在且数量不容小觑。最后,设计的对比实验表明本文实施的调查是可靠且有效的。
其他文献
目的探讨运动想象联合刺激控制护理对于肿瘤合并卒中患者偏瘫步态和步行能力的影响效果。方法选择秦皇岛市第四医院门诊输液室2014年4月至2016年4月收治的120例肿瘤合并卒中
主持和导游,看上去是两个相对独立的专业,其实,主持专业的语言表达和导游讲解之间存在着很多相似的地方.……
导数是高中数学课程的重要内容,而且与大学将要学习到的微积分知识密切相关,考虑到高中生的认知水平以及时代的要求,高中生学习导数知识具有一定的可行性。因为概念教学是学
一、美术欣赏教学的现状与发展趋势 传统的美术欣赏教学一般有专题欣赏与随堂欣赏两种,这两种教学都有其优点与弊端,并且随着教育改革的深入进行,其弊端也越来越凸现。专题欣赏
洗马林断裂为洗马林-水泉断裂的西北段,是洋河盆地北缘断裂带的组成断裂之一,位于张家口-渤海断裂构造带与山西断陷盆地带的复合部位,其构造几何和变形特征是研究两大构造带相互作用的良好素材。文中采用地质地貌调查和地球物理探测等手段对该断裂进行探查和研究,阐述了断裂的几何展布、构造特征与活动性,分析了其与邻近断裂的构造关系,讨论了其在洋河盆地北缘断裂带中的变形转换作用。研究结果显示:洗马林断裂是1条以走滑
本文介绍一种利用 LM2907、L-M2917系列芯片研制的具有高增益运算、放大、比较功能的频率/电压转换装置。该型转换装置由于仅有四个外部元件(两个电阻和两个电容),所以结构简
采用缝子隧穿辐射的新方法,并考虑到能量守恒,深入研究了稳态轴对称NUT-Taub黑洞的隧穿辐射特征.结果表明,黑洞视界处粒子的隧穿率与Bekenstein-Hawking熵有关,其真实的辐射谱不再
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield