论文部分内容阅读
在网页坐标系中运用VIPS(Vision-based page segmentation)理论,对网页中信息块的重要性进行判定.该方法利用网页创建过程中的设计习惯和人类浏览信息过程中的视觉焦点判定,按九宫格划分页面区域分布并在此基础上识别主题信息,论文最后选取新闻类型网站网页,按不同页面分割比例检测了网页信息块空间层次和主题信息块提取间的关系.