论文部分内容阅读
我国的电子词典自上个世纪80年代末诞生以来得到了迅速发展,虽然只有二十年的历史,电子词典却已经成为词典家族中具有旺盛生命力的一员。电子技术的发展使得辞书的载体、查检和阅读方式发生了根本的变化。电子词典软件的应用也越来越广泛,可以使用到一般的掌上电子产品。
随着词典数据的海量化,词典功能的多样化,电子词典的结构也需要随着词典的需求做出调整。电子词典的简单搜索技术已不能满足需要,还要考虑到其内容和有何特殊性,即对现有的词库式数据库加以特殊定义,使内部数据的内容有序地排列,并且能以简单的结构表达较为复杂的内容。
本文通过分析目前的电子词典的存储架构和检索技术,提出了一种改进的基于混合存储的技术方案和在压缩后的键树上采用基于二分法或基于映射关系的检索方法。根据单词查询的过程,本文同时提出一种新型的基于三级存储架构的嵌入式电子词典的设计,基于该架构下的电子词典通过用数字映射XML标签,比目前的词典占用更小的存储空间,提取更加方便。通过标签信息转换后的词典存储结构分为索引层,词头层和数据层:索引层可以选择索引策略,有时还可以采用稀疏索引的方式;词头层可以根据具体需要而进行单词的排列,并支持单词的重复出现;数据层保存数据的解释信息。针对添加单词等词库更新操作,本文提出了基于三级存储架构下的更新词库的方案,并且使用了外存监视表的方式,更有效的利用外存空间。最后,将电子词典软件的系统设计在快译通电子词典3360VM上的实际应用,证明了本文提出的存储架构所用存储空间小,而且有效的支持了嵌入式电子词典软件的开发,此外,三级存储架构结构简单,通用性强,对电子词典的批量开发具有一定的指导意义。