google 的良苦用心:網站管理員工具 |
發布時間: 2012/9/14 15:13:54 |
2005年的google做了大量的調整,因為到了05年,很多SEO的方法慢慢泛濫了起來。同時很多網站主對google如何對待他們的網站一直沒有明確的途徑去了解。google應對這個局面的方法非常的開放,也非常聰明,就是希望和網站主達成一種雙贏的局面。所以有了google webmaster tools (網站管理員工具)這個工具。
這個工具從推出到現在,經歷了很多次的增增減減,它努力追求讓這個工具越來越對站長有利。一直以來,我都看到很多人對它的認識還不夠深刻,所以單獨來講一講這個工具是很有必要的。 《利用Google Search Appliance 服務器做SEO》一文中,我曾經說:“會把GSA后臺的操作也講述一下。到時候你會對google webmaster tool這個工具有更深一層的理解。” GSA就是一臺把google整個硬件和軟件打包在一起的服務器。這臺服務器就是一個小型的google搜索引擎,它以前的版本的名字就叫 google mini , 能形象的說明這個服務器的性質。 ![]() 黃色的是GSA,藍色的是google mini
現在我就把GSA后臺的截圖發出來,大家一定能發現點什么。 ![]() GSA后臺 這個后臺對很多人來說一定有似曾相識的感覺,因為在google webmastel tools里,不光界面和這個相似,里面的很多功能其實都已經有了。 google webmastel tools的前身是google sitemaps,以前主要的用途是讓網站主解決爬蟲的抓取故障和提交sitemap。這兩大功能其實只解決了google爬蟲抓取的局限性,這主要只解決了google自己的問題。而那時SEO越來越流行,很多網站甚至用作弊的方法來做SEO。大家這么忙活,無非是想從google上面多拉一點流量,這個是廣大網站主需要解決的問題。 本來,SEO看起來和搜索引擎是矛盾的。百度對SEO的認識就是這樣,所以它仇視SEO,把自己和很多做SEO的網站主搞得處于對立的局面。 但是google不這么認為的。因為搜索引擎需要大量的網站來供應內容,它的期望是內容主次分明,越優質越好。而網站主希望能從搜索引擎獲取流量,期望值是流量不光越多越好,還要越匹配越好的。那兩者之間其實可以達成雙贏的局面。 我做了很多年SEO,雖然從google獲得了大量的流量。但是也越來越發現我是在給google打工的。因為我把一個網站的結構理順了,把重要的內容突出了,google就知道了我網站有些什么內容,也知道了這些內容中的重點。這樣,至少在判斷我這個網站講了什么內容的時候,google是很有把握的。而當很多網站都這么做的時候,google的內容質量整體就上升了一個等級。用戶從google搜索到的內容更符合他們的需求了。同時,網站主憑借著主次分明的內容拿到的流量也是匹配網站主需求的優質的流量。 google從一開始就會這樣說:“好吧,網站主,既然你想得到你想要的流量,那你提供相關的內容給我。你如果不知道什么是相關的內容,那么我來告訴你,還告訴你怎么來突出重點。” 所以《google網站質量指南》里的幾百篇文章,以及google webmastel tools都是來告訴你要如何提供什么內容給搜索引擎。在我看來,google webmastel tools是google提供的最好的SEO工具,里面的每一個功能都是和SEO相關的,google在里面告訴你了要如何做SEO。 GSA的硬件和google現在用的服務器是一樣的,包括傳說中的自帶電源和從沒向外界說過的幾公斤重的散熱片。 ![]() google的專利-自帶電源 這個GSA的軟件部分,后臺應該是google.com的老版本的一個子集。所以你可以簡單的認為google的后臺也是這樣的。為了能盡量為網站主著想,google陸陸續續的把后臺的一些功能都放進了google webmastel tools里。對于google來說,只要不泄露自己的核心機密,很多的數據和工具,如果能對網站主做好SEO有幫助的話,就把它開放出來讓大家使用。 我就不一一說明每個功能在SEO上的作用,因為這個里面的很多細節都繁瑣得可以寫成一篇文章。以下就講幾個最近在google webmastel tools增減的功能,看看google是出于什么目的來調整的。 1,google webmastel tools 里有個控制爬蟲“抓取速度”的選項,以前只能控制三個速度,就是“更快”、“正常”、“更慢”。而在我以前操作的google mini(GSA的老版本)中,也有這樣一個調節爬蟲抓取速度的選項,但是是一個拉動的滑塊,可以調節出非常精確的抓取速度來。某一天,當我驗證完一個新站的時候,發現google webmastel tools也已經是這樣的了。 ![]() 調節抓取速度 這個對于很多網站來說是很有好處的,因為那些網站不怕你爬蟲來得多了把服務器爬死,就怕你不經常來。 2,最近增加的“像 Googlebot 一樣抓取”的功能,在GSA的后臺也是有的,只是不是這種表現形式。為什么要加一個這樣的功能呢?這是因為google在抓取很多網站的時候碰到的一些問題越來越多才加這個功能的。 ![]() 模擬google爬蟲 同一個網頁,搜索引擎爬蟲看到的和你用瀏覽器看到的其實是不一樣的。因為瀏覽器有很大的容錯性,你少一個<div>,或者html標簽沒有關閉,只要不錯得離譜的話,網頁看起來還是很正常的。 但是搜索引擎爬蟲是不會這樣的,你在CMS上或者代碼上有什么問題,會讓爬蟲看不到你的頁面。所以你需要模擬搜索引擎爬蟲去訪問你的網頁,看看搜索引擎訪問到的源代碼是不是你真實的源代碼。這個google模擬爬蟲,還可以查看一個網頁的返回碼。這是因為一個網頁,如果你給搜索引擎返回多個返回碼,根據各種情況,搜索引擎要么不收錄你的網頁,要么你的用戶從搜索引擎點進你的網站會出現500錯誤(服務器內部錯誤)。 我在《Lynx瀏覽器在SEO上的應用》一文中建議大家用Lynx去訪問你的網頁也有這樣的原因, 那個工具也可以實現這樣的功能。可惜的是盡管google在《網站質量指南》里力薦這個瀏覽器,但是還是很多人不會去用,所以google干脆把這個功能放在google webmastel tools里了。 3,我還是低估了google的良苦用心程度。當我前幾天看到新推出的這個“參數處理”的功能的時候,幾乎要感動得哭了。 ![]() 參數調節功能 大家可能對URL靜態化是有一些疑慮的。因為很久以前google說URL要靜態化,而google年初的時候又說不要靜態化了。為什么會有這么截然不同的說法呢? 其實URL靜不靜態化根本不是問題的核心,核心問題是出在URL的參數上。如果有人仔細去看《HTTrack 在SEO上的應用》一文,并不斷地去使用這個工具的話,就會發現:是因為URL上的參數復雜,才導致了爬蟲陷入死循環的。現在即使你把URL靜態化,如果沒有處理好的話,和沒有去靜態化是一樣的效果。關于這點以后還要寫一篇文章才能說得清楚。 google當然清楚是由參數引起的,所以在以前,它都是有一套自己的方法過濾參數的。但是,這個過濾方法并不一定很準,可能你覺得不是參數的重要的頁面,google把你過濾了,那就不會收錄了。所以google就干脆讓你自己來調節,先自動過濾一些參數,然后讓你看看哪些參數過濾錯了,或者還有哪些參數沒有過濾,就由你來告訴google。 本文出自:億恩科技【www.laynepeng.cn】 |