基于向量空间模型的分层网页分类方法

来源 :南通大学学报(自然科学版) | 被引量 : 0次 | 上传用户:youyou306
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种基于向量空间模型的多层网页分类方法.该方法用主题词、修正主题词和主题概念从3个层次构建网页表示向量,从而在概念层次上更贴近网页的语义,且向量维数低于传统的特征向量.实验结果表明.该方法降低了分类时的计算量,提高了网页分类速度和分类精度。
其他文献
《第四二胡协奏曲——爱恨情仇》这首曲子是著名音乐家关乃忠先生受新加坡华乐团邀请创作的作品,乐曲以“文姬归汉”的故事为素材,描绘了蔡文姬在动荡不安的社会中,跌宕起伏的命
针对一类存在输入时滞的非线性离散系统,研究其鲁棒镇定问题。假设输入时滞是时变的,其上下界已知,利用Lyapunov-Krasovskii泛函方法和Finsler引理,得到了鲁棒镇定控制器存在
基于带Markov链利率的离散时问风险模型和Markov链将来利率与过去利率的独立性,假设个体净风险是重尾分布的,利用全概率公式和递推方法,得到该风险模型下有限时间破产概率的近似