基于支持向量机的搜索引擎垃圾网页检测研究

来源 :云南民族大学学报:自然科学版 | 被引量 : 0次 | 上传用户:lurenjia1983
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
搜索引擎垃圾网页作弊的检测问题一般被视为一个二元分类问题,基于机器学习的分类算法建立分类器,将网页分成正常网页和垃圾网页2类.现有的基于内容特征的垃圾网页检测模型忽略了网页之间的链接关系,故构建了软间隔支持向量机分类器,以网页的内容特征作为支持向量,根据网页之间的链接具有相似性的特点定义了惩罚函数,使用样本集学习,得出了线性支持向量机网页分类器,并对分类器的分类效果进行了测试.实验结果表明基于支持向量机的分类器的效果明显好于使用内容特征构建的决策树分类器.
其他文献
介绍了循环流化床燃烧技术优点及基本原理,并对该技术应用于包钢锅炉改造和煤矸石、洗煤泥、高炉煤气等劣质燃料的资源化利用以及危险废物处理可行性进行了分析,认为该技术在
大棚滴灌具有降低湿度、提高地温、节水、省工、高效、增产等许多优点。但大棚滴灌机械在使用中常出现灌水器损坏、滴孔堵塞、出水均匀度差及流量变小等毛病。为了避免以上毛
从降低电压、提高电流效率的方法着手,阐述了中铝青海分公司200kA预焙铝电解槽降低直流电耗的途径。
常规基于图像的绘制方法要求多幅图像作为输入或事先已知场景的三维信息才能生成新的图像.而TIP(tour into the picture)技术仅需一幅场景图像便可以生成新的视图,实现三维场景的虚拟漫游.详细介绍和实现了基于TIP的交互建模与漫游,用户可以根据自己对图像的理解,利用鼠标任意设置场景关键点以恢复其三维模型,实现交互式的真实感漫游.
总结了传统圆填充算法存在的不足,提出了基于圆的对称等分点画线算法的圆内区域填充算法,该算法把圆周等分为圆的周长份数,然后用直线连接各对称等分点,即实现填充.该算法原理简单
随着国家惠农政策的广泛实施.农机购置补贴正逐步成为一项制度.而如何使此项制度科学健康运行.在推进农机化发展中形成长效机制.笔者拟结合农村实际.谈点粗浅看法。
冬天,渴望温暖,是个进补的季节。我热爱冬季,不仅仅是因为我出生在寒冬,更主要的原因是冬日天寒地冻无处可去,少了许多应酬,静下心来,躲在家里啃书便是最好的进补方式!读书,重在读,贵在