论文部分内容阅读
校园网络中存在着大量的教育资源,包括图书资料、网络数据库、教学课件、管理系统等数据资源,还有网站、新闻、电子邮件、BBS等动态信息,由于资源种类繁多、形态各异,载体形式和使用平台不尽相同,资源结构和数据质量优劣不同,因此目前教育资源的开放性和流动性较差,校园网络内存在着明显的“数据孤岛”现象。为了建立完善的数字化校园,解决上述问题的核心任务就是建立统一的数据描述机制,深入挖掘资源数据间的联系,提高资源的有效利用。本文通过研究教育资源的使用现状以及它们的特点,提出了统一采用XML技术进行资源描述的方案,解决资源数据互操作性以及机器可理解性的问题。本文详细介绍了元数据的相关知识,研究了XML技术在教育资源描述中的优势和不足,提出了以DC等元素集为语义标准、RDF为结构标准、XML为语法标准的教育资源元数据描述体系的概念。此体系能够使各种资源有统一的描述机制、清晰的描述结构、开放的描述标准,以及灵活的描述方法。在对教育资源单体进行元数据描述的基础上,又针对资源集合进行了元数据描述研究,资源集合的使用可以降低发现资源个体的成本、实现资源间的联邦检索、进行机器可理解的知识导航。本文以学位论文等教育资源为例,详细说明了资源及资源集合的元数据描述机制,并将资源的元数据描述方法应用于济南大学博硕士论文数据库的科研项目中。使用XML对教育资源进行描述后,下一步遇到的将是面对大量的XML数据,怎样才能有效地获得所需的知识。本文最后对XML文档的数据挖掘进行了初步研究,将XML文档的挖掘分为结构挖掘和内容挖掘两大类,介绍了使用分类、聚类、关联等数据挖掘方法进行分析的知识,并针对部分典型的教育资源进行了数据挖掘的模式分析。在国内,教育资源的元数据化及资源集合元数据化的研究还处于引进和探索阶段,本文针对校园网络中教育资源的描述提出了自己的观点。并在学位论文数据库的建设中进行了实际应用,对数字化校园的建设、网络教育体系的发展具有一定的指导意义。