現在的位置: 首頁 > 搜索技術 > 正文

如何在Sitemaps中表示網址?創建Sitemaps後會發生什麼

2020年05月21日 搜索技術 ⁄ 共 1845字 ⁄ 字型大小 評論關閉

  大家可能知道通過Google網站管理員工具後台向Google提交Sitemaps。Google網站管理員工具,雖然談不上十分十分的強大,但是卻是十分十分的實用。下面學步園小編來講解下如何在Sitemaps中表示網址?創建Sitemaps後會發生什麼?

  如何在Sitemaps中表示網址

  對於所有XML文件,任何數據數值(包括網址)都應使用以下字元實體轉義碼:&符號(&)、單引號(')、雙引號(")、小於(<)和大於(>)。還應確保所有網址遵循RFC-3986URI標準、RFC-3987IRI標準以及XML標準。如果您要使用腳本來生成網址,通常可以使用網址轉義的方式將其轉義為該腳本的一部分。並且您仍然需要對它們進行實體轉義。例如,以下Python腳本實體轉義http://www.example.com/view?widget=3&count>2

  以下是引用片段:

  $python

  Python2.2.2(#1,Feb242003,19:13:11)

  >>>importxml.sax.saxutils

  >>>xml.sax.saxutils.escape(http://www.example.com/view?widget=3&count>2)

  以上示例所得網址為:http://www.example.com/view?widget=3&count>2問題:使用哪種字元編碼方法生成Sitemaps文件有關係嗎?是的。您的Sitemaps文件應該使用UTF-8編碼。

  如何指定時間?

  對此協議中的lastmod時間戳以及所有其他日期和時間,請使用W3CDatetime編碼。例如,2004-09-22T14:12:14+00:00。

  此編碼允許您省去ISO8601格式的時間部分,例如:2004-09-22也是有效的。然而,如果您的網站頻繁更改,則鼓勵您使用時間部分,以便抓取工具可獲取關於您網站的更全面的信息。

  如何計算lastmod日期

  對於靜態文件,這是實際的文件更新日期。可以使用UNIX日期命令獲取此日期:

  以下是引用片段:

  $date--iso-8601=seconds-u-r/home/foo/www/bar.html

  >>2004-10-26T08:56:39+00:00

  對於許多動態網址,您可以根據基本數據的更改時間或使用一些基於定期更新(如果可行的話)的近似值輕鬆地計算lastmod日期。使用一個近似日期或時間戳就可以幫助抓取工具避免抓取還未更改的網址。這將降低Web伺服器的帶寬和CPU要求。

  我將Sitemaps放在哪裡

  強烈建議將Sitemaps放置在HTML伺服器的根目錄中,即,將其放置在http://example.com/sitemap.xml.gz。

  在某些情況下,您或許會希望在網站上針對不同的路徑創建對應的Sitemaps—例如,如果在您的組織中,安全許可對應不同目錄劃分上傳許可權。

  我們認為如果您有上傳http://example.com/path/sitemap.xml.gz的許可,那麼您也可以通過http://example.com/path/報告元數據。

  我的Sitemaps可以有多大

  Sitemaps在壓縮時不應超過10MB(10,485,760位元組),且最多可以包含50,000個網址。也就是說,如果您的網站包含的網址超過50,000個或Sitemaps大於10MB,您需要創建多個Sitemaps文件,並使用Sitemaps索引文件。即使您的網站較小,但計劃的網址數量超出50,000個或文件大小超過10MB,也應使用Sitemaps索引文件。

  我的網站擁有數千萬個網址;我可以採用某種方式只提交最近更改過的網址嗎?

  您可以在少數頻繁更改的Sitemaps中列出已更新的網址,然後使用Sitemaps索引文件中的lastmod標記驗證這些Sitemaps文件。隨後,搜索引擎即可逐步抓取(只抓取)這些已更改的Sitemaps。

  創建Sitemaps後會發生什麼

  在創建Sitemaps後,您需要通知搜索引擎Sitemaps的位置。得到通知的搜索引擎就可以檢索您的Sitemaps並使網址可以由抓取工具抓取。

  以上就是關於「如何在Sitemaps中表示網址?創建Sitemaps後會發生什麼」的內容,希望對大家有用。更多資訊請關注學步園。學步園,您學習IT技術的優質平台!

抱歉!評論已關閉.