如果我們從搜索引蜘蛛的角度去看待一個(gè)網(wǎng)站,在抓取、索引和排名時(shí)會(huì )遇到哪些問(wèn)題呢?解決了這些問(wèn)題的網(wǎng)站設計就是搜索引擎友好的設計
1.搜索引蜘蛛不能找到網(wǎng)頁(yè)
要讓搜索引擎發(fā)現網(wǎng)站首頁(yè),就必須要有外部鏈接到首頁(yè),找到首頁(yè)后,蜘蛛沿著(zhù)內部鏈接找到更深的內容頁(yè),所以要求網(wǎng)站要有良好的結構,符合邏輯并且所有頁(yè)面可以通過(guò)可爬行的普通HTML鏈接達到,Javascript鏈接、Flash中的鏈接等搜索引擎蜘蛛一般不能跟蹤爬行,就會(huì )造成收錄問(wèn)題。
網(wǎng)站所有頁(yè)面離首頁(yè)點(diǎn)擊距離不能太遠,最好在四五次點(diǎn)擊之內。要被搜索引擎收錄,頁(yè)面需要最基本的權重,良好的網(wǎng)站鏈接結構可以適當傳遞權重,使盡量多的頁(yè)面達到收錄門(mén)檻。
2.找到網(wǎng)頁(yè)后能不能抓取頁(yè)面內容
URL必須是可以被抓取的。數據庫動(dòng)態(tài)生成、帶有過(guò)多參數的URL、整個(gè)頁(yè)面都是Flash、框架結構、可疑的轉向、大量復制內容等都可能使搜索引擎敬而遠之。某些文件站長(cháng)不希望被收錄,除了不鏈接到這些文件,更保險的方法是使用 ROBOTS.TXT或者 meta robots標簽禁止收錄。
3.抓取頁(yè)面后怎樣提取有用信息
關(guān)鍵詞在頁(yè)面重要位置的合理分布、重要標簽的編寫(xiě)、HTML代碼精精簡(jiǎn)、起碼的兼容性等可以幫助搜索引擎理解頁(yè)面,提取有用信息。只有搜索引擎能順利找到所有頁(yè)面,抓取這些頁(yè)面并提取其中真正相關(guān)性的內容,網(wǎng)站才可以被視為搜索引友好的設計。

既然找到了問(wèn)題的根源,那么怎么進(jìn)行網(wǎng)頁(yè)設計才能最大程度提升搜索引擎的友好度呢?
(1)目錄結構和URL。
URL是統一資源定位,即每個(gè)網(wǎng)頁(yè)的網(wǎng)址、路徑。網(wǎng)站文件的目錄結構直接體現于URL。清晰簡(jiǎn)短的目錄結構和規范的命名不僅有利于用戶(hù)體驗和網(wǎng)址傳播,更是搜索引擎友好的體現。
(2)目錄層次。
對于一個(gè)小型網(wǎng)站來(lái)說(shuō),一般只有一層子目錄
如:http://www.yoursite.com/dirl/page.htm
www.yoursite.com是域名,dirl是一級目錄名,page是文件名。對搜索引擎而言,這種單一的目錄結構最為理想,即扁平結構(Fat)。
(3)目錄和文件命名。
根據關(guān)鍵字無(wú)所不在的原則,可以在目錄名稱(chēng)和文件名稱(chēng)中使用到關(guān)鍵詞。但如果是關(guān)鍵詞組,則需要用分隔符分開(kāi)。
(4)絕對URL和相對URL。
絕對URL:即網(wǎng)頁(yè)路徑使用包含頂級域名在內的完整的URL。
如:www.yoursite.com/pagel/index.html是一個(gè)絕對路徑,其中/pagel/in-dex.html則為相對路徑,由瀏覽器自動(dòng)在該鏈接前加上www.yoursite.com??傮w上,Google在排名時(shí)并不在意URL使用的是相對路徑還是絕對路徑。
(5)導航結構。
網(wǎng)站導航是對引導用戶(hù)訪(fǎng)問(wèn)網(wǎng)站的欄目、菜單、在線(xiàn)幫助、布局結構等形式的統稱(chēng)。其主要功能在于引導用戶(hù)方便地訪(fǎng)問(wèn)網(wǎng)站內容,是評價(jià)網(wǎng)站專(zhuān)業(yè)度、可用度的重要指標。同時(shí)對搜索引也產(chǎn)生諸多提示作用。概括地講,網(wǎng)站在導航方面應注意以下幾點(diǎn):
①主導航醒目清晰。
②“面包屑型( Breadcrumbs)”路徑。
③首頁(yè)突出重要內容。
④使用網(wǎng)站地圖。
(6)框架結構。
框架型網(wǎng)站的優(yōu)越性體現在頁(yè)面的整體一致性和更新方便上。尤其對于那些大型網(wǎng)站而言,框架結構的使用可以使網(wǎng)站的維護變得相對容易。但框架對搜索引摹來(lái)說(shuō)是一個(gè)很大的問(wèn)題,這是由于大多數搜索引擎都無(wú)法識別框架,也沒(méi)有什么興趣去抓取框架中的內容。此外,某些瀏覽器也不支持框架頁(yè)面。
(7)圖像優(yōu)化。
一般而言,搜索引擎只識讀文本內容,對圖像是不可見(jiàn)的。同時(shí),圖像文件直接延緩頁(yè)面加載時(shí)間,如果超過(guò)20秒網(wǎng)站還不能加載,用戶(hù)和搜索引擎極有可能離開(kāi)你的網(wǎng)站。
(8)Alt屬性。
每個(gè)圖像標簽中都有Alt屬性,搜索引擎會(huì )讀取該屬性以了解圖像的信息。因此,最好在所有插圖的Alt屬性中都有文字描述,并帶上該頁(yè)關(guān)鍵字在其中。
(9)文本說(shuō)明。
除了Alt屬性文字,還可以考慮以下方法直接優(yōu)化圖像,使之被搜索到:
①在圖片上方或下方加上包含關(guān)鍵詞的描述文本。
②在代碼中增加一個(gè)包含關(guān)鍵詞段的 heading標題標簽,然后在圖片下方增加文字描述。
③在圖片下方或旁邊增加如“更多某某”鏈接,包含關(guān)鍵詞。
④創(chuàng )建一些既吸引用戶(hù)又吸引搜索引擎的文本內頁(yè),先把流量吸引到這些頁(yè)面,再提供文本鏈接指向你的圖片頁(yè)面。
(10)Gif和JPGE圖像優(yōu)化。
對圖片文件優(yōu)化的目的是在盡量不影響圖像畫(huà)面效果的情況下,將其文件大小降到最低,以加快頁(yè)面整體下載速度。
(11)FLASH優(yōu)化。
FLASH優(yōu)化可以從以下三個(gè)方面來(lái)考慮:
①做一個(gè)輔助HTML版本;
②將Flash內嵌HTML文件,付費登錄搜索引擎。
(12)表格使用。
如果某個(gè)網(wǎng)頁(yè)采用了大段的長(cháng)篇文本,除了可以將一頁(yè)文本分成多面,還可以考慮將文本置入不同表格中,這樣不僅管理方便,也使得該頁(yè)加載時(shí)每個(gè)表格內容依次加載,這樣訪(fǎng)問(wèn)者就可以一邊看已下載內容一邊等待剩余部分加載,而不是等待很久之后才一齊加載出來(lái)。表格之內套嵌太多表格也不利于頁(yè)面加載,因瀏覽器是先加載完大表格之后再加載內嵌的小表格,因此內嵌表格會(huì )最終降低整頁(yè)加載速度。
(13)網(wǎng)頁(yè)減肥。
代碼不妥不僅延長(cháng)網(wǎng)頁(yè)加載時(shí)間,也嚴重影響蜘蛛程序對網(wǎng)頁(yè)內容的抓取。去掉臃腫雜亂的代碼,減小網(wǎng)頁(yè)文件大小,能夠加快網(wǎng)頁(yè)加載速度,讓蜘蛛快速索引到重要內容。
(14)Javascript
采用Javascript技術(shù)的網(wǎng)頁(yè)往往在頁(yè)面一開(kāi)始就堆積大量JAVA代碼,以至META及關(guān)鍵字遲遲不能出現,被推至頁(yè)面底部,對搜索引擎很不友好。有兩種方法可以使之得以改善:
①將腳本移至頁(yè)面底部。
②將JAVA腳本置入一個(gè),js擴展名的文件。
(15)301水久重定向。
301水久重定向頁(yè)面也叫301轉向或者301跳轉,它的作用就是將域名永久地轉移到另一域名上去??蓜e小看了這個(gè)簡(jiǎn)單的功能,在許多時(shí)候起著(zhù)不可替代的作用,比如:網(wǎng)站更換域名,網(wǎng)頁(yè)批量跳轉,更重要的是301頁(yè)面對于網(wǎng)站的SEO方面。
301跳轉會(huì )告訴搜索引,網(wǎng)址已經(jīng)遷移。這時(shí)搜索引擎會(huì )對新的網(wǎng)址進(jìn)行抓取,同日時(shí)還會(huì )將舊網(wǎng)址的原有連接和外鏈逐步轉移至新的網(wǎng)址下,這就意味著(zhù)新域名可以得到老域名的權重,從而將域名更換的影響降到最低。
不過(guò)從實(shí)踐來(lái)看,情況并不像理論上那么好。301起作用還是比較緩慢的,有的網(wǎng)站設置301跳轉將近半年,可百度依然將老域名排在前面,新域名則落在了老域名的后面。
(16)404錯誤頁(yè)面。
當用戶(hù)輸入了錯誤的鏈接時(shí),將返回404錯誤頁(yè)面給用戶(hù),這個(gè)頁(yè)面是為了提醒用戶(hù)地址不存在而設置的
對于搜索引擎來(lái)說(shuō),如果蜘蛛訪(fǎng)問(wèn)的某個(gè)URL卻返返回了404錯誤的頁(yè)面,這時(shí)蜘蛛就知道這個(gè)頁(yè)面是不存在的,便不再抓取這個(gè)頁(yè)面,同時(shí)會(huì )向搜索引整的數據中心提交這個(gè)URL,從而將這個(gè)網(wǎng)址從索引中刪除。
(17)500服各器內部錯誤提示頁(yè)面
服務(wù)器、數據庫出錯總是無(wú)法預料的,如果這些地方先出出了故障,并且正好搜索引擎的蜘蛛抓取到了這個(gè)返回了404的頁(yè)面,那對于搜索引擎將會(huì )產(chǎn)生非常不好的印象。怎么才能解決這個(gè)問(wèn)題呢?500頁(yè)面就是個(gè)很好的方法。
500頁(yè)面是一個(gè)帶有草屋描述的頁(yè)面,它告訴搜索引擎該網(wǎng)站目前出現了個(gè)暫時(shí)性的小技術(shù)性問(wèn)題,或許是數據庫出錯,或許是網(wǎng)站維護。這樣蜘蛛就不用吃閉門(mén)羹,自然會(huì )友好很多。
(18)友好錯誤頁(yè)面。
IS默認的錯誤頁(yè)是很不友好的,很多人看到默認的錯誤頁(yè)時(shí)都會(huì )說(shuō):網(wǎng)站打不開(kāi)了!白白損失了這部分流量。而如果錯誤頁(yè)直接跳轉到首頁(yè)又對搜索引擎很不友好,搞不好首頁(yè)還會(huì )被封掉。所以根據情況,有兩個(gè)方法解決這個(gè)問(wèn)題如果是博客等內容型的網(wǎng)站,可以返回一個(gè)帶有404錯誤的搜索框讓訪(fǎng)客搜索,若是電子商務(wù):%%%%%%%%%型網(wǎng)站,則可以返回一個(gè)帶有404錯誤的進(jìn)度條進(jìn)行跳轉。這兩種方法既照顧了訪(fǎng)客又顧及到了SEO??梢?nbsp;Google webmaster tools中查看自己網(wǎng)站錯誤頁(yè)有多少。
修改默認錯誤頁(yè)的方法很簡(jiǎn)單:在IS中右鍵單擊要管理的網(wǎng)站,在自定義錯誤中設置404為相應的錯誤信息:htp:/ww.………&&&.com.cn/enews/頁(yè)這里有兩種方式:
①如果“消息類(lèi)型”你選擇的是“文件”,則則只能使用.html或htm結尾的文件,否則用戶(hù)訪(fǎng)問(wèn)錯誤頁(yè)時(shí)會(huì )出現:http:/product.……&&&.com.cn/pnce plist32_2535. shtml碼。用這種方式設置的錯誤頁(yè),雖然.hml文件中沒(méi)有輸出404狀態(tài),但IS執行后會(huì )自動(dòng)輸出404狀態(tài)。
②如果“消息類(lèi)型”你選擇了“URL",則必須用asp文件(因為只有在asp文件中才能設置404狀態(tài)),否則訪(fǎng)問(wèn)錯誤頁(yè)時(shí)會(huì )返回200狀態(tài)碼。如果你希望定時(shí)跳轉到首頁(yè),則也有兩種方法
①利用meta標簽的 refresh進(jìn)行跳轉。據Google中文博客管理員介紹, Yahoo就使用的此方法進(jìn)行跳轉。
②使用講行跳轉。我感覺(jué)使用is的方法t好一些搜索引擎會(huì )識別為“200”或“302”。
常??吹皆S多網(wǎng)站的自定義404錯誤頁(yè)面采取類(lèi)似這樣的形式:首先顯示一段錯誤信息,然后,通過(guò) Meta Refresh將頁(yè)面跳轉到網(wǎng)站首頁(yè)、網(wǎng)頁(yè)地圖或其他類(lèi)似頁(yè)。根據具體實(shí)現方式不同,這類(lèi)404頁(yè)面可能返回“200”狀態(tài)碼,也可能返回“302臨時(shí)重定向”,但不論哪種,從SEO技術(shù)角度看,均不是一種合適的選擇。
制作中文友好網(wǎng)頁(yè)同樣是一種討好搜索引擎非常重要的方方法,當你按照上述方法對網(wǎng)站制作進(jìn)行修改和設計后,是否發(fā)現蜘蛛一下子跟你親呢了很多?你在搜索主頁(yè)的排名是不是開(kāi)始穩穩上升了?
本文地址:http://havencoinwallet.com//article/3411.html