论文部分内容阅读
随着现代信息技术的飞速发展,“信息爆炸”产生的危机日益殃及个人信息管理,信息的爆炸性增长使人们日常需要处理的信息量迅速增长。用户面对浩如烟海的信息世界,往往无法快速准确地找到自己想要的信息。用户在计算机中查找个人文件时,有时会因为记不住确切的文件名、存放位置而遇到困难,现有的基于关键词的桌面搜索工具不能帮助用户有效地解决这一问题。通过对人类记忆行为的分析,本文针对不同的信息搜索需求,提出了解决方法。本文主要贡献如下:(1)提出了基于日志的个人信息搜索框架和自动搜集用户访问日志的方法,并且该方法被应用于自动监控用户访问行为的个人信息搜索原型系统中,同时,将该原型系统在实验室一些人的电脑上运行一段时间后,得到了一个用于后续实验的数据集。(2)提出了基于同义词的个人信息搜索策略。通过对搜集的用户个人访问日志的分析,作者发现文件名中包含的词语之间具有同义词关系,进而提出了基于同义词的个人信息搜索策略。具体包括:提出了个人同义词概念模型,定义了个人文件、个人词典、词语偏好度、同义词图、文件关键词向量等基本概念,基于此模型,进一步提出了个人同义词词典与同义词图的增量构建方法,以及基于同义词的个人文件搜索策略。(3)提出了基于访问时间的个人信息搜索策略。在进一步分析日志的过程中,发现个人文件之间的引用关系与用户对文件的访问时间有一定关系,基于此提出了基于引用关系的个人信息搜索策略。具体包括:首先提出了一个基于访问时间关系的引用模型,提出并阐述了引用关系、桌面访问行为、顺序行为列表、顺序包含等基本概念,进而提出了基于重叠时间来识别引用关系的方法,以及基于引用关系的个人信息搜索策略。(4)对提出的方法进行了系统实现。基于本文提出的访问日志搜集方法、同义词搜索策略和文件引用关系识别方法,进行了系统实现,并将上述功能增加到实验室开发的个人信息管理原型系统中,通过实际的使用验证了本文所提方法的有效性。