XMLサイトマップ
XMLサイトマップとは、ウェブサイトのURLリストを指す。検索エンジンにURLリストのクロールを行ってもらう目的があり、利用が可能なコンテンツとそのアクセス方法を伝えるロードマップとして機能する。
XMLサイトマップは、そのページがいつ更新されたか、ページの更新頻度、ウェブサイト内の相対的な重要性などを通知することも可能。
SEOに与える影響として、検索エンジンのクローリングの手助けとなり、簡単に認識してくれるため、ページのインデックス登録・又は解除を高速化することが可能になる。
XMLサイトマップとRSS・Atomフィードの生成・送信を推奨
GoogleはXMLサイトマップとRSS・Atomフィードの両方生成・送信を推奨している。
理由としては、XMLサイトマップのファイルサイズは通常大きくなる場合が多く、Googleのダウンロード頻度が低くなる傾向にあり、RSS・Atomフィードは通常小さいファイルサイズのため、XMLサイトマップと同時に「RSSフィード 又は Atomフィード」を生成し、Googleに送信する(Goolge Search Consoleで伝える)した場合、Google検索に対し、更新をさらにスピーディに知らせることに役立つため。
これらの内容はGoogle検索セントラルの「Best practices for XML sitemaps & RSS/Atom feeds」に記載されている。
XMLサイトマップ形成コードと上限
XMLサイトマップは通常以下のコードで形成される。
- ページがWebサイトのどこにあるか(そのURL):<loc>URL</ loc>
- ページが最後に変更された日時:<lastmod>日時</ lastmod>
- 任意:ページが変更される頻度:<changefreq>頻度</ changefreq>
- 任意:サイト上の他のページとの関係でページが持つ優先度:<priority>優先</ priority>
また、XMLサイトマップは通常、1ファイル50,000件のURLが上限となる。(ニュースと画像のXMLサイトマップは例外で1ファイル1,000件)
これらの内容はGoogle検索セントラルの「サイトマップの作成と送信」で確認できる。
<priority>に対してGoogleは無視
ページの優先度である「<priority>」は、Googleは参考にせず(無視して)クロールする。