一种基于噪音清除的网页削重算法

来源 :信阳师范学院学报(自然科学版) | 被引量 : 0次 | 上传用户:fgq861218
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出了一种基于噪音清除的网页削重算法.首先应用空间向量模型,仅仅使用〈特征词,权重〉二元组表示网页,降低削重算法的时空复杂度;其次,通过一组启发式规则来消除网页中包含的“噪音”,消除了无关信息对网页核心内容的干扰.
其他文献
分析了传统企业应用集成技术中存在的弊端和不足,提出采用基于Web Services为技术路线的企业应用集成方案.在实现信息系统之前,先就系统使用的Web Services架构进行了深入的研究
研究硝酸钠存在下,溴化十六烷基三甲基铵·硫氰酸铵体系浮选n(Ⅳ)的行为及与一些金属离子分离的条件.实验结果表明,当溶液中溴化十六烷基三甲基铵、硫氰酸铵、硝酸钠的浓度分
以聚醚砜(PES)为膜材,聚乙烯吡咯烷酮(PVP)为添加剂,N,N-二甲基乙酰胺(DMAC)为溶剂,用相转化法制备了超滤膜.利用正交试验法,研究了制膜参数PES浓度、PVP浓度、蒸发时间、凝固浴温度、凝
以甲基丙烯酸甲酯(MMA)、甲基丙烯酸丁酯(BMA)为单体,或以其混合物为接枝单体,对聚苯乙烯-聚异戊二烯-聚苯乙烯(SIS)进行接枝共聚制备溶剂型胶粘剂.研究了引发剂用量、单体配比、反应
在回顾国内外学者研究注意缺陷多动障碍(ADHD)的基础上,结合临床实践,就其中西医结合治疗,提出:应充分认识到ADHD是一种慢性疾病,需建立相应的管理计划,医生与患儿、家长、教