论文部分内容阅读
目前,全国各高校在校本学位论文管理和再利用方面存在较大差异。大部分高校已经实现校本学位论文的有效管理和利用,但仍存在不少院校的校本学位论文管理力度不够、管理状况混乱、利用率极低,电子录入与检索系统尚未形成。因此,数字化的校本学位论文管理成为高校图书馆数字化工程的一项重要任务。本文分析了我国部分高校在校本学位论文管理及再利用方面存在的问题,从某大学校本学位论文管理的实际需求出发,采用.NET Framework系统架构,设计与开发了一个校本学位论文管理系统。该系统主要功能包括:用户登录、论文提交、论文检索、论文评论、论文统计等。依据向量空间模型思想,提出了一种相关度检索排序算法。该算法先采用特征抽取方式和组合(Caption+Keywords+Abstract)查询技术,按照模糊和精确匹配的特征词发现,获得初始检索结果集。然后采用“位置因子+词频因子”标记学位论文,计算初始检索结果集中各文档的相关度,并按照相关度大小重新排序,将排序结果集返回给用户。将该检索算法用于山西师范大学校本学位论文管理,被测数据集选择该校1994年至2008年硕士学位论文2002篇。实验证明,该算法较传统的检索算法在查全率和查准率方面有较大改进,学位论文检索结果基本达到了用户的需求。通过几个月试用,该系统运行效果良好,切实解决了校本学位论文管理中的实际问题,满足了高校图书馆校本学位论文数字化管理的要求。