论文部分内容阅读
介绍了语义网,本体以及语义标注的基本概念,对现有的语义标注方法以及技术进行了说明和分析。针对目前互联网上含有大量语义信息的HTML文档,提出了一种自动化的语义标注的方法。该方法对HTML文档进行结构分析,并参照词汇数据库Hownet和领域本体对文档进行语义分析,找出文档对应的语义分类树,给文档加上语义标签。以电子消费品领域的HTML文档为实验对象,实验结果证明了该方法具有一定的可行性。