優(yōu)惠活動(dòng) - 12周年慶本月新客福利
優(yōu)惠活動(dòng) - 12周年慶本月新客福利
優(yōu)惠活動(dòng) - 12周年慶本月新客福利

如何避免蜘蛛陷阱

有一些網(wǎng)站設計技術(shù)對搜索引擎來(lái)說(shuō)很不友好,不利于蜘蛛爬行和抓取,這些技術(shù)被稱(chēng)為蜘蛛陷阱。常見(jiàn)的應該全力避免的蜘蛛陷阱包括如下這些。



1、Flash

在網(wǎng)頁(yè)的某一小部分使用 Flash增強視覺(jué)效果是很正常的,比如用Flash做成的廣告圖標等。這種小 Flash 和圖片是一樣的,只是HTML代碼中的很小一部分,頁(yè)面上還有其他以文字為主的內容,所以對搜索引擎抓取和收錄沒(méi)有影響。

但是有的網(wǎng)站整個(gè)首頁(yè)就是一個(gè)大的Flash文件,這就構成了蜘蛛陷阱。搜索引擎抓取的HTML代碼只有一個(gè)連向Flash文件的鏈接,沒(méi)有其他文字內容。讀者可以參考前面例子的源代碼,搜索引擎是無(wú)法讀取Flash文件中的文字內容和鏈接的。這種網(wǎng)站整個(gè)就是一個(gè)Flash的網(wǎng)站,可能視覺(jué)效果做得精彩異常,可惜搜索引擎看不到,不能索引出任何文字信息,也就無(wú)從判斷相關(guān)性。

有的網(wǎng)站喜歡在首頁(yè)放一個(gè)Flash動(dòng)畫(huà)片頭(Flash Intro),用戶(hù)訪(fǎng)問(wèn)網(wǎng)站看完片頭后被轉向到真正的 HTML版本的文字網(wǎng)站首頁(yè),搜索引擎不能讀取 Flash,一般也沒(méi)辦法從Flash Intro跟蹤到 HTML版本頁(yè)面。
 
近幾年搜索引擎不停嘗試讀取Flash文件,尤其是里面的文字內容和鏈接,也取得了一定進(jìn)展.站長(cháng)可以使用SWFObject和 sIFR 等技術(shù)使 Flash文件更易于被搜索引擎讀取不過(guò)我的觀(guān)點(diǎn)是,與其費勁去研究怎么讓搜索引擎讀取 Flash 文件,不如裝成普通的 HTML版本的網(wǎng)站,如果你的網(wǎng)站除了 Flash 外不足以展現公司實(shí)力,那么你的公司應該是世界500 強級別的.SEO就不重要了。

整個(gè)網(wǎng)站就是一個(gè)大Flash文件,從SEO角度來(lái)說(shuō)是萬(wàn)萬(wàn)不可的。如果 Flash 效果是必需的,至少也需要在首頁(yè)加上一個(gè)通往 HTML版本的鏈接,這個(gè)鏈接應該是在 Flash 文件之外的 HTML 代碼中,搜索引擎跟蹤這個(gè)鏈接可以抓取后面的 HTML版本頁(yè)面。

2、Session ID

有些網(wǎng)站使用Session ID〔會(huì )話(huà) ID)跟蹤用戶(hù)訪(fǎng)問(wèn),每個(gè)用戶(hù)訪(fǎng)問(wèn)網(wǎng)站時(shí)都會(huì )生成獨特唯一的Session ID,加在URL中,搜索引擎蜘蛛的每一次訪(fǎng)問(wèn)也會(huì )被當成一個(gè)新的用戶(hù),URL中會(huì )加上一個(gè)不同的Session ID,這樣搜索引擎蜘蛛每次來(lái)訪(fǎng)問(wèn)時(shí)所得到同一個(gè)頁(yè)面的URL將不一樣,后面帶著(zhù)一個(gè)不一樣的Session ID.這也是最常見(jiàn)的蜘蛛陷阱之一。

搜索引擎遇到這種長(cháng)長(cháng)的Session ID,會(huì )嘗試判斷字符串是Session ID還是正常參數.成功判斷出Session ID就可以去掉Session ID,收錄正常URL.但也經(jīng)常判斷不出來(lái),要么不愿意收錄,要么收錄多個(gè)冊有不同Session ID的URL,內容卻完全一樣,形成大量復制內容,這兩種情況對網(wǎng)站優(yōu)化都不利。

通常建議跟蹤用戶(hù)訪(fǎng)問(wèn)應該使用cookies 而不要生成Session ID,或者程序判斷訪(fǎng)問(wèn)者是搜索 引擎蜘蛛還是普通用戶(hù),如果是搜索引擎蜘蛛,則不生成 Session ID,跟蹤搜索引擎蜘蛛訪(fǎng)問(wèn)是沒(méi)什么意義的,蜘蛛既不會(huì )填表,也不會(huì )把商品放入購物車(chē) 。
 
3、各種跳轉

除了后面會(huì )介紹的301轉向以外,搜索引擎對其他形式的跳轉都比較敏感,如302跳轉.JavaScript跳轉、Flash跳轉、Meta Refresh跳轉。

有些網(wǎng)站用戶(hù)訪(fǎng)問(wèn)首頁(yè)時(shí)會(huì )被自動(dòng)轉向到某個(gè)目錄下的頁(yè)面,如果是按用戶(hù)地理位置轉向至最適合的目錄,那倒情有可原,但大部分這種首頁(yè)轉向看不出任何理由和目的,這樣的轉向能避免則避免。

如果必須轉向,301 轉向是搜索引擎推薦的、用于網(wǎng)址更改的轉向,可以把頁(yè)面權重從舊網(wǎng)址轉移到新網(wǎng)址。其他轉向方式都對蜘蛛爬行不利,原因在于后面作弊一章所要介紹的,黑帽 SEO 經(jīng)常使用轉向欺騙搜索引擎和用戶(hù),所以除非萬(wàn)不得已,盡量不要使用301轉向以外的跳轉。
 
4、框架結構

如果作為站長(cháng)的你不知道什么是框架結構(Frame),那么恭喜你,你已經(jīng)避免了這個(gè)蜘蛛陷阱,根本沒(méi)必要知道什么是框架結構,如果你在網(wǎng)站設計中還在使用框架結構,我的建議是立即取消。

使用框架結構設計頁(yè)面,在網(wǎng)站誕生初期曾經(jīng)挺流行,因為對網(wǎng)站的頁(yè)面更新維護有一定方便性,不過(guò)現在的網(wǎng)站已經(jīng)很少使用框架了,不利于搜索引擎抓取是框架越來(lái)越不流行的重要原因之一。對搜索引擎來(lái)說(shuō),訪(fǎng)問(wèn)一個(gè)使用框架的網(wǎng)址所抓取的 HTML 只包含調用其他 HTML 文件的代碼,并不包含任何文字信息,搜索引擎根本無(wú)法判斷這個(gè)網(wǎng)址的內容是什么,雖然蜘蛛可以跟蹤框架中所調用的其他HTML 文件,但是這些文件經(jīng)常是不完整的頁(yè)面,比如沒(méi)有導航只是正文,搜索引擎也無(wú)法判斷框架中的頁(yè)面內容應該屬于主框架,還是屬于框架調用的文件。

總之,如果你的網(wǎng)站還在使用框架,或者你的老板要使用框架結構,唯一要記住的是,忘記使用框架這回事。和 Flash 一樣,別浪費時(shí)間研究怎么讓搜索引擎收錄框架結枃網(wǎng)站。

5、動(dòng)態(tài)URL

動(dòng)態(tài)URL指的是數據庫驅動(dòng)的網(wǎng)站所生成的、帶有問(wèn)號、等號及參數的網(wǎng)址,一般來(lái)說(shuō)動(dòng)態(tài)URL 不利于搜索引擎蜘蛛爬行,應該盡量避免。

6、JavaScript鏈接

由于JavaScript可以創(chuàng )造出很多吸引人的視覺(jué)效果,有些網(wǎng)站喜歡使用JavaScript腳本生成導航系統,這也是比較嚴重的蛛蛛陷阱之一,雖然搜索引擎都在嘗試解析s腳本不過(guò)我們不能寄希望于搜索引擎自己去克服困難,而要讓搜索引擎跟蹤爬行鏈接的工作盡一量簡(jiǎn)單容易。

據我觀(guān)察,雖然有的搜索引擎在技術(shù)上可以獲得 JavaScript 腳本中包含的鏈接,甚至可以執行腳本并跟蹤鏈接,但對一些權重比較低的網(wǎng)站,搜索引擎覺(jué)得沒(méi)有必要,不會(huì )費那個(gè)勁,所以網(wǎng)站上的鏈接必須使用最簡(jiǎn)單標準的 HTML 鏈接,尤其是導航系統 用css做導航系統一樣可以實(shí)現很多視覺(jué)效果。

JavaScript 鏈接在 SEO 中也有特殊用途,那就是站長(cháng)不希望被收錄的頁(yè)面 (比如沒(méi)有排名意義的頁(yè)面,重復內容頁(yè)面等),不希望徹底權重的鏈接,可以使用 JavaScript腳本阻擋搜索引擎爬行。
 
7、要求登錄

有些網(wǎng)站內容放在需要用戶(hù)登錄之后才能看到的會(huì )員區域,這部份內容搜索引擎無(wú)法看到,蜘蛛不能填寫(xiě)用戶(hù)名、密碼,也不會(huì )注冊。

8、強制使用 Cookies

有些網(wǎng)站為了實(shí)現某種功能,如記住用戶(hù)登錄信息、跟蹤用戶(hù)訪(fǎng)問(wèn)路徑等,強制用戶(hù)使用 Cookies,用戶(hù)瀏覽器如果沒(méi)有啟用 Cookies,頁(yè)面 顯示不正常.搜索引擎蜘蛛就相當于一個(gè)禁用了 Cookies 的瀏覽器,蕪湖網(wǎng)站設計強制使用Cookies只能造成搜索引擎蜘蛛無(wú)法正常訪(fǎng)問(wèn)。
本文地址:http://havencoinwallet.com//article/2767.html
相關(guān)文章:
最新文章:
国产免费丝袜调教视频爱剪辑|国产小受18asian|国产福利91精品一区二区三区|久久久青草大香|欧美丰满熟妇xxxx性