论文部分内容阅读
笔者正在做一个项目“先秦汉语词汇统计与知识检索”,准备对25种最重要的先秦传世文献进行词语切分、词性标注、个别常用词的词义标注,建立先秦书面汉语的词汇知识库以及先秦文献的历史知识库并研制相应的检索系统。有关文献选择、版本选择、校勘等方面的问题,本文想主要就先秦汉语的词汇计算和内容计算两个方面的问题向在座专家汇报初步想法并希望得到指教。