網站地圖-(Sitemap) |
發布時間: 2012/9/15 14:45:32 |
什么是 Sitemap
Sitemap 可方便管理員通知搜索引擎他們網站上有哪些可供抓取的網頁。最簡單的 Sitepmap 形式,就是 XML 文件,在其中列出網站中的網址以及關于每個網址的其他元數據(上次更新的時間、更改的頻率以及相對于網站上其他網址的重要程度為何等),以便搜索引擎可以更加智能地抓取網站。
Sitemap協議講解
Google SiteMap Protocol 是Google自己推出的一種站點地圖協議,此協議文件基于早期的robots.txt文件協議,并有所升級。在Google官方指南中指出加入了Google SiteMap文件的網站將更有利于Google網頁爬行機器人的爬行索引,這樣將提高索引網站內容的效率和準確度。文件協議應用了簡單的XML格式,一共用到6個標簽,其中關鍵標簽包括鏈接地址、更新時間、更新頻率和索引優先權。
Google SiteMap文件生成后格式如下:
<urlset xmlns=http://www.google.com/schemas/sitemap/0.9>
<url>
<loc>http://www.SemCmd.com</loc>
<lastmod>2005-06-03T04:20-08:00</lastmod>
<changefreq>always</changefreq>
<priority>1.0</priority>
</url>
</urlset>
SiteMap XML標簽的解析:
changefreq:頁面內容更新頻率,
lastmod:頁面最后修改時間
loc:頁面永久鏈接地址
priority:相對于其他頁面的優先權
url:相對于前4個標簽的父標簽
urlset:相對于前5個標簽的父標簽
注意:XML文件必須為UTF-8編碼格式,不管你是手動生成還是通過代碼生成,建議最好檢查一下xml文件是否是utf-8編碼,最簡單的方法就是用記事本打開xml然后另存為時選擇編碼(或轉換器)為UTF-8。
怎么樣制作SiteMap XML工具
請查看SiteMap XML 地圖生成工具詳細講解與制作
如何提交SiteMap XML 地圖
登錄Google 管理員工具 (https://www.google.com/webmasters/tools/)
注 意:
1、一個站點地圖可以包含一個網址列表或站點地圖列表。
2、如果您的站點地圖包含另一組站點地圖,您應將自己的站點地圖另存為站點地圖索引文件,并使用該文件類型專用的 XML 格式。每個站點地圖索引文件最多可以列出 50,000 個站點地圖。
3、一個站點地圖文件包含的網址不得超過 50,000 個,且未壓縮時不得大于 10MB。如果您的站點地圖超過了這些限值,請將其拆分為幾個小的站點地圖。這些限制條件有助于確保您的網絡服務器不會因向 Google 提供大文件而超載。
4、使用相同的語法指定所有網址。例如,如果您指定網站的位置為 http://www.semcmd.com/,則網址列表中不應包含以 http://semcmd.com 開頭的網址。如果您指定網站的位置為 http://semcmd.com/,則網址列表中不應包含以 http://www.semcmd.com// 開頭的網址。
5、請不要在網址中包含會話 ID。
6、請不要在站點地圖中包含直接圖片網址。Google 不會將圖片直接編入索引中,而是將顯示圖片的網頁編入索引。站點地圖中包含的直接圖片網址不會編入索引。
7、站點地圖網址必須進行編碼,以便于所在的網絡服務器進行讀取。另外,它只可以包含 ASCII 字符,不能包含大寫 ASCII 字符、某些控制碼或特殊字符(如 * 和 {} 等)。如果您的站點地圖網址包含這些字符,在您試圖添加該網址時就會顯示錯誤消息。 本文出自:億恩科技【www.laynepeng.cn】 |