XMLサイトマップ

2023年2月23日 (木) 09:41時点におけるMasahiko Tsuji (トーク | 投稿記録)による版

XMLサイトマップとは、ウェブサイトのURLリストを指す。検索エンジンにURLリストのクロールを行ってもらう目的があり、利用が可能なコンテンツとそのアクセス方法を伝えるロードマップとして機能する。

XMLサイトマップは、そのページがいつ更新されたか、ページの更新頻度、ウェブサイト内の相対的な重要性などを通知することも可能。

SEOに与える影響として、検索エンジンのクローリングの手助けとなり、簡単に認識してくれるため、ページのインデックス登録・又は解除を高速化することが可能になる。

XMLサイトマップとRSS・Atomフィードの生成・送信を推奨

サムネイルの作成エラー: ファイルがありません
Google Search ConsoleのXMLサイトマップ・RSS・Atomフィードの送信画面

GoogleはXMLサイトマップとRSS・Atomフィードの両方生成・送信を推奨している。

理由としては、XMLサイトマップのファイルサイズは通常大きくなる場合が多く、Googleのダウンロード頻度が低くなる傾向にあり、RSS・Atomフィードは通常小さいファイルサイズのため、XMLサイトマップと同時に「RSSフィード 又は Atomフィード」を生成し、Googleに送信する(Goolge Search Consoleで伝える)した場合、Google検索に対し、更新をさらにスピーディに知らせることに役立つため。

これらの内容はGoogle検索セントラルの「Best practices for XML sitemaps & RSS/Atom feeds」に記載されている。

XMLサイトマップ形成コードと上限

XMLサイトマップは通常以下のコードで形成される。

  • ページがWebサイトのどこにあるか(そのURL):<loc>URL</ loc>
  • ページが最後に変更された日時:<lastmod>日時</ lastmod>
  • 任意:ページが変更される頻度:<changefreq>頻度</ changefreq>
  • 任意:サイト上の他のページとの関係でページが持つ優先度:<priority>優先</ priority>

また、XMLサイトマップは通常、1ファイル50,000件のURLが上限となる。(ニュースと画像のXMLサイトマップは例外で1ファイル1,000件)

これらの内容はGoogle検索セントラルの「サイトマップの作成と送信」で確認できる。

<priority>に対してGoogleは無視

ページの優先度である「<priority>」は、Googleは参考にせず(無視して)クロールする。

エビレンス

<lastmod>は情報が正確ならGoogleは利用