面向搜索引擎的网站建设
搜收录网整理 发布日期:2014/10/2 0:00:00


网站中每个网页,都应当是网站结构的一部分,都应当能经过过程其他网页链接到。


独霸百度供给的URL优化工具搜检

百度站长平台供给了URL优化工具,可以辅助搜检URL对搜索引擎的和睦程度并提出改削倡议。

百度倡议
如非需要,不要做整站内容的完整更换

网站改版或者网站内重要页面链接产生变换时,应当将改版前的页面301永远重定向到改版后的对应的页面。

百度倡议
确保每个页面都可以经过过程最少一个文本链接达到;


重要的内容,应当能从首页或者网站结构中斗劲浅的条理访谒到;


公道分类网站上的内容,不要过度细分。经过过程死链删除的接口可让百度更快更周全的创造网站死链,从而进行有用删除。 
 
公道的返回码
百度爬虫在进行抓取和措置时,是遵守http和谈标准来设置响应的逻辑的,所以请站长们也尽可能参考http和谈中对于返回码的寄义的界说进行设置。 
 
网站应当有扼要、明确的导航,可让用户快速找到本人需要的内容,同时也能够辅助搜索引擎更好的体味网站的结构。在这类景象,倡议新发内容且则返回403,等审核或做好措置往后,再返回正常状态的返回码。

同时,网站也应当是一个网状结构,网站上每个网页都应当有指向上、下级网页以及相干内容的链接:首页有到频道页的链接,频道页有到首页和通俗内容页的链接、通俗内容页有到上级频道以及首页的链接、内容相干的网页间彼此有链接。


网站更换域名,应当将旧域名的所有页面301永远重定向到新域名上对应的页面

网站更换域名后,连结旧域名能不变访谒尽可能长的时刻,给用户多一些时刻记忆新域名。网站死链过量,不单影响用户的访谒体验,也会影响百度对网站质量的剖断。

403 返回码的寄义是 “Forbidden”,百度会感触网页当前防止访谒。


不添加不能被系统主动辨感到url组成部分的字符

url中插手了";"、","等字符,用户在经过过程论坛、即时通信工具等渠道举荐这些url时,不能被主动辨感到链接,增长了用户访谒这些网页的坚苦度。对搜索引擎的优化,同时也会让用户受益。搜索引擎只是网站上一个通俗的访客,对网站的抓取编制、对网站/网页的价值剖断,也都是从用户的角度解缆的,任何对用户体验的改良,都是对搜索引擎改良。


有一些网站但愿百度只收录部分内容,例如审核后的内容,堆集一段时刻的新用户页等等。 
 
改版/换域名
网站改版、换域名在互联网飞速成长的景象下是不成防止的,但措置不妥,会造成重大的流量丧失。503可以告诉百度spider该页面姑且不成访谒,请过段时刻再重试。简略来讲,就是收录、排序、揭露。


正常的动态url对搜索引擎没有影响

url是动态还是静态对搜索引擎没有影响,但倡议尽可能削减动态url中包含的变量参数,这样即有助于削减url长度,也能够削减让搜索引擎掉入黑洞的风险。

百度倡议
在某个频道的内容没有丰富到可以算作一个自力站点存在之前,操作目录情势;等频道下堆集了足够的内容,再转换成子域名的情势

一个网页能否排到搜索功效的前面,"身世"很重要,若是出自一个站点权重较高的网站,那排到前面的可能性就越大,反之则越小。对于网页返回503,百度 spider 不会把这条 URL 直接删除,短时辰内会再访谒。

面向搜索引擎的网站造就汲引,重要分为三个部分:若何更好的让搜索引擎收录网站中的内容、若何在搜索引擎中获得精采的排名、若何让用户从泛滥的搜索功效中点击你的网站。 
 
独霸站短工具
互联网愈来愈复杂、复杂,百度为了更好的措置互联网上的信息,供给了一些的面向站长的工具,公道的独霸这些站短工具,可以起到事半功倍的下场。


域名间内容做好权限,彼此分隔,a.example.com下的内容,不能经过过程b.example.com访谒

子域名间的内容可以彼此访谒,可能会被搜索引擎算作几次再三内容而进行除重措置,保存的url没需要定是正常域名下的。

在内容没有丰富到可以做为一个自力站点之前,内容放到主站点下一个目录中能在搜索引擎中获得更好的默示。 
 
标准、简略的url
建树存在精采描写性、标准、简略的url,有益于用户更便利的记忆和剖断网页的内容,也有益于搜索引擎更有用的抓取您的网站。当然百度spider 此刻对301跳转的响应周期较长,可是我们还是举荐大师这么做。

百度倡议
操作文字而不是flash、图片、Javascript等来显示重要的内容或链接;


若是必须操作Flash建造网页,倡议同时建造一个供搜索引擎收录的文字版,并在首页操作文本链接指向文字版;


Ajax等搜索引擎不能辨认的手艺,只用在需要用户交互的处所,不把但愿搜索引擎"看"到的导航及正文内容放到Ajax中;


不操作frame和iframe框架结构,经过过程iframe显示的内容可能会被百度丢弃。树型结构的扩大性更强,网站内容变多时,可以经过过程细分树枝(频道)来轻松应对。经过过程sitemap可让百度收录的更有用率。可是若是网页长久返回403,百度也会感触是失效链接,从搜索功效中删除。

503 返回码的寄义是 “Service Unavailable”,百度会感触该网页姑且不成访谒,凡是网站姑且关闭,带宽有限等会产生这类景象。凡是景象下主站点的权重是最高的,子站点会从主站点担负一部分权重,担负的若干很多若干好多,视子站点质量而定。 

机械可读
百度经过过程一个叫做Baiduspider的法式榜样抓取互联网上的网页,经过措置后建入索引中。

改版、换域名需要考虑的第一要点就是若何保障老用户不流失,当用户访谒旧内容时,能领导用户到新网站上对应的内容,防止闪现用户访谒不到之前保藏的网页的景象。可是若是网页长久返回503,那么这个 URL 仍会被百度感触是失效链接,从搜索功效中删除。当碰着站点迁移、域名更换和站点改版的景象时,举荐操作301返回码,尽可能削减改版带来的流量丧失。今朝Baiduspider只能读懂文本内容,flash、图片等非文本内容且则不能措置,放置在flash、图片中的文字,百度没法辨认。


站点迁移,或域名更换时,请操作301返回码。 
 
网站结构
网站应当有明确的结构和了了的导航,这能辅助用户快速从你的网站中找到本人需要的内容,也能够辅助搜索引擎快速懂得网站中每个网页所处的结构条理。网站设计之初,就应当有公道的url筹算。象一棵大树一样,首先有一个树干(首页),而后再是树枝(频道),最后是树叶(通俗内容页)。 


若是百度spider对您的站点抓取压力过大,请尽可能不要操作404,一样倡议返回503。这样百度spider会过段时刻再来测验测验抓取这个链接,若是阿谁时刻站点余暇,那它就会被成功抓取了。

百度倡议
网站中同一网页,只对应一个url

若是网站上多种url都能访谒一样的内容,会有以下危险:

a. 搜索引擎会选一种url为标准,可能会和正版分歧
b. 用户可能为同一网页的分歧url做举荐,多种url情势分别了该网页的权重

若是你的网站上已经存在多种url情势,倡议按以***例措置:

a. 在系统中只操作正常情势url,不让用户接触到非正常情势的url
b. 不把Session id、统计代码等不需要的内容放在url中
c. 分歧情势的url,301永远跳转到正常情势
d. 防止用户输错而启用的备用域名,301永远跳转到主域名
e. 操作robots.txt防止Baiduspider抓取您不想向用户揭露的情势


让用户能从url剖断出网页内容以及网站结构信息,并可以展望将要看到的内容


URL尽可能短

长长的URL不单不雅,用户还很难从中获得额外有用的信息。

网站结构倡议采用树型结构,树型结构凡是分为以下三个条理:首页——频道——文章页。此外一方面,短url还有助于减小页面体积,加速网页翻开速度,提升用户体验。

百度倡议
为每个页面都加上导航栏,让用户可以便利的返回频道、网站首页,也可让搜索引擎便利的定位网页在网结构中的条理;


内容较多的网站,倡议操作面包屑式的导航,这更轻易让用户懂得当前所处的地位:网站首页 > 频道 > 当前浏览页面 ; 


导航中操作文字链接,不操作复杂的js或者flash; 


操作图片做导航时,可操作Alt注释,用Alt告诉搜索引擎所指向的网页内容是甚么。 

301 返回码的寄义是 “Moved Permanently”,百度会感触网页当前跳转至新URL。届时若是网页已复原,则正常抓取;若是持续返回503,短时辰内还会几次再三访谒几次。 

总结一下,公道的网站结构应当是一个扁平的树型网状结构。

倡议操作文字而不是flash、图片、Javascript等来显示重要的内容或链接,搜索引擎且则没法辨认Flash、图片、Javascript中的内容,这部分内容没法搜索到;仅在flash、Javascript中包含链接指向的网页,百度可能没法收录。


不要滥用子域名

无丰富内容而滥用大批子域名,会被搜索引擎当造作弊步履而遭到赏罚。

理想的网站结构应当是更扁平一些,从首页到内容页的条理尽可能少,这样搜索引擎措置起来,会更简略。

百度倡议
若是站点姑且关闭,当网页不能翻开时,不要立即返回404,倡议操作503状态。


死链删除
百度站长平台撑持经过过程sitemap向百度提交网站的死链列表。

Sitemap
百度站长平台撑持经过过程sitemap提交网站内容。 
子域名与目录的选择
选择操作子域名还是目录来公道的分拨网站内容,对网站在搜索引擎中的默示会有较大的影响。

我们倡议在改版或者换域名时,将旧网页301永远重定向到内容对应的新网页,这样百度更轻易创造这个转变,并活络的将旧网页堆集的权值传递给对应的新网页。下面我们将从这三个方面分袂先容。对于这类景象,若是是新创造的URL,百度 spider 暂不抓取,短时辰内会再次搜检;若是是百度已经收录的URL,当前也不会直接删除,短时辰内一样会再访谒。接洽关系度不高的内容,放在分歧的子域名下,可以辅助搜索引擎更好的懂得站点的主题。届时若是网页答应访谒,则正常抓取;若是仍禁绝可访谒,短时辰内还会几次再三访谒几次。

Baiduspider 对常常操作的http返回码的措置逻辑是这样的: 

404 返回码的寄义是 “Not Found”,百度会感触网页已经失效,那么凡是会从搜索功效中删除,而且短时辰内 spider 再次创造这条 URL 也不会抓取。


内容分歧度较大、接洽关系度不高的内容,操作子站点情势

搜索引擎会辨认站点的主题,若是站点中内容接洽关系度不高,可能导致搜索引擎短处的辨认。
信息网址:http://www.soshoulu.com/ziyuan/view2015.htm
相关信息