一种基于分隔条的网页分块算法

来源 :计算机应用与软件 | 被引量 : 6次 | 上传用户:zz121961437
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络信息时代的到来使得网络中的信息量呈指数增长,由此研究如何从网页中高效地提取出有用信息成为网络信息检索领域中的重要课题。从网页的可视性和统一性两大基本特征出发,提出一种通过检测分隔条对网页进行分块的算法,并使用相对位置排版的概念解决在部分分块的高度未知的情况下如何表示各分块的相对位置的问题。分块过程中,通过已分块数、节点的信息长度、宽高等信息综合确定分块的终止条件,保证了算法的执行效率和有效性。实验结果说明,该算法具有较高的执行效率。
其他文献
前言自主创新能力是国家的核心竞争力,也是企业生存和发展的关键,是产业发展的必然选择。只有切实提高自主创新能力,充分发挥科技进步对经济社会发展的巨大推动作用,才能为保持经
为了改善粒子群的局部收敛能力和收敛速度,在经典粒子群优化算法和量子理论的基础上,提出一种改进的基于量子行为的粒子群优化算法。在新算法中,运用全同粒子系更新粒子位置,并引入空间混沌思想[1]。将新算法应用到虚拟射手飞碟训练系统中射点的三维姿态参数优化中,取得了很好的优化效果。
动态透明的云给人们的生活带来了无限的可能,同时也对虚拟世界中与日俱增的数字身份的隐私和安全问题提出了更大的挑战。数字身份和信息服务有着密切关系,在访问或分享资源前,用户和服务双方的身份都有必要先通过认证。特别是当身份窃取猖獗的时候,有力地用户认证、合作伙伴认证、云服务提供商认证等是至关重要的措施。分析云身份认证的现状和面临的挑战,基于谓词加密和Active Bundle思想提出了安全活跃束SAB(
12007年上半年山东机械行业经济运行情况1.1综合经济指标完成情况全省机械工业共有13个行业,主要有:农业机械、汽车工业、电工电器、工程机械、机床工具、内燃机、石化通用机械
2006年是“十一五”开局的第一年,全省机械工业战线上的广大干部职工在省委、省政府的领导下,认真贯彻党的十六大和十六届四中、五中、六中全会精神,把握机遇,真抓实干,大胆实践,开
基于深度图像的室内场景理解是计算机视觉领域中的前沿问题。针对三维室内场景中平面较多的特性,提出一种基于高斯混合模型聚类的深度数据分割方法,实现对场景数据的平面提取。首先将Kinect获取的深度图像数据转换为离散三维数据点云,并对点云数据作去噪和采样处理;在此基础上计算所有点的法向量,利用高斯混合模型对整个三维点云的法向集合聚类,然后利用随机抽样一致性算法对各个聚类进行平面拟合,由每个聚类得到若干平