反搜索引擎作弊的相关方面
搜收录网整理 发布日期:2014/10/2 0:00:00

  摘要:随着互联网技术的发展和宽带应用的日益普及,搜索引擎已成为人们获取网络信息最重要的手段之一。基于网络利益的驱动,出现了一些靠欺骗搜索引擎的技术来实现目标网页排名的搜索引擎作弊行为。本文介绍了常见的搜索引擎作弊手法,并对反搜索引擎作弊做出了相关探讨,以防止在网站的搜索引擎优化操作过程中被搜索引擎误以作弊惩罚。

  关键词:搜索引擎;搜索引擎优化;搜索引擎作弊

  中图分类号:TP391.3 TP393.2文献标识码:A

  1搜索引擎相关概述

  (1)搜索引擎的工作原理

  ①搜索引擎首先会派出能够在互联网上自动搜索的引擎蜘蛛,网络推广通过互联网之间的网址来抓取网页的内容。

  ②搜索引擎蜘蛛会把找到的信息带回数据服务器,用分析索引系统对收集回来的信息进行分析处理,使用相关度算法得出网页和关键词的相关度,然后通过关键字、描述等相关信息进行分门别类整理,清除网页垃圾,压缩后,再编类到索引里。

  ③当用户进行相关关键词查询时,搜索引擎对经过用户提交的关键字进行分析,从索引数据库中找到匹配的信息,为用户找出最为接近的结果,再通过与之关联度最为接近到最不接近为序排列下来,呈现在最终用户眼前。

  (2)搜索引擎优化

  就是使用一些技术手段,通过某些关键词将某个网站排列到搜索引擎结果页的前列,以增加网站的曝光率和点击率,最终达到网站推广的目的,是近年来最常用的一种网络营销方式。

  (3)搜索引擎作弊

  就是利用搜索引擎排序算法的漏洞,为了提高网站排名而采取的搜索引擎作弊手段。

  2常见搜索引擎作弊的手法

  (1)桥页

  “桥页”也叫过渡页,针对某一关键词特地制作一个优化的页面,网络推广链接指向或重定向到手段页面,页面打开后会自动转向别的页面。当普通用户访问时采用一个页面,而对搜索引擎访问时却采用另外一个页面以提高在搜索引擎中的排名。

  (2)误导性症结关键词

  指在页面中使用与该网页不相关的误导性要害词、热门关键词来吸引查询该关键词的访问者来访问网站,以达到成心误导用户访问本网站,从而提高网站点击率的目的。

  (3)隐藏技术

  ①隐藏文本内容:旨在不影响网站美观的前提下,通过隐藏包含大量关键词的网页提高关键词相关性得分,从而达到改善搜索引擎排名的目的。

  ②隐藏链接:旨在不影响网站美观的前提下,通过在其它页面添加指向目标优化页的隐形链接,以达到晋升链接网页的权重,从而提高搜索引擎排名。

  ③隐藏页面:通过技术手段和强大的IP地址库来分析访问者的IP来源,如果来访者是普通用户,返回的是用户版网页,让用户正常浏览;如果来访者是搜索引擎蜘蛛,网页就返回为搜索引擎蜘蛛特意优化的网页,以向搜索引擎提供非真实的友好内容来晋升网页排名。

  (4)关键词堆砌

  关键词堆砌是指在网页中非常密集地放置关键词,希望增加关键词密度,提高网页针对关键词的相关度,从而提升网页在搜索引擎中的排名。

  (5)复制的站点或网页

  通过复制网站或网页的内容并分配给不同域名和服务器,以此欺骗搜索引擎对同一站点或同一网页进行反复索引,让搜索引擎蜘蛛做重复工作。

  (6)链接仓库

  链接仓库是典范的作弊链接技巧,指由大批网页交叉链接构成的网页,这些网页可能来自于同一个域名或多个不同的域名,甚至可能来自不同的服务器。一个站点当参加“链接工厂”后,它可得到来自该体系中所有网页的链接,同时作为“交流”它须要“奉献”自己的链接,借此方式来晋升链接得分,从而达到干涉链接得分的目的。

  3反搜索引擎作弊的相关探讨

  (1)内容的贝叶斯分析

  贝叶斯定理也称贝叶斯推理,在18世纪,由英国学者贝叶斯提出计算条件概率的公式,简述为某件事情发生的概率大致可以由它过去发生的频率近似地估计出来。

  关键词之间的相关性可以从训练spam(搜索引擎作弊)样本和非spam样本得到。例如页面里出现:免费,或者在线电影都不能判断为spam,但是同时出现“免费”,“在线电影”就极有可能是spam。

  (2)关键词密度判断

  所谓关键词密度,即是指该关键词在网页中所占的比例。网络营销根据搜索引擎蜘蛛抓取网页的结果,当页面中某个词汇的总数在所有词汇之间的比率超过约7%时,搜索引擎则判定为作弊行为。

  (3)页面相似性分析

  根据搜索引擎蜘蛛抓取网页的时候,若同一个域名下有很多个相似的页面或完全相同的页面,创建包含大量重复内容的多个网页、子域或域,搜索引擎则判定为作弊行为。

  (4)通过域名、IP地址之间的连接数量

  一个网站的外部链接数越多其PR(网页级别)值就越高;外部链接站点的级别越高(假如新浪、谷歌网站链接到你的网站上),网站的PR值就越高。通过查询网站是不是专门提供一些链接服务,如果查询到某一个页面的导出外链接数值达到一个阀值,就可以认定该网站是SPAM,但是对于hao123、256等导航网址搜索引擎有不同的算法和处理方法。

  (5)建立SPAM黑名单

  对于多次作弊的服务器和域名的IP地址,应建立黑名单和待观察名单。根据搜索引擎蜘蛛抓取到的网站的IP和IP黑名单进行比较并做出相应的计算处理。


  
信息网址:http://www.soshoulu.com/zixun/view15011.htm
相关信息