インデックス(index)
インデックス(index)とは、検索エンジンの検索結果にウェブページを追加するプロセスであり、検索エンジンが見つけたすべてのウェブサイトの情報が含まれているデータベースの別名のことを言います。
Googleは、ユーザーが検索する前から、膨大な数のウェブページからを利用して情報を収集し、Google「クローラー(Googlebot)」がページにアクセスすると、検索インデックスに登録して整理しています。
登録が行われた後、Google のウェブマスター向けガイドライン(品質に関するガイドライン)に準拠している場合、コンテンツやその内容の意味が分析され、そのページがGoogle のインデックスに保存されます。(このことを「インデックス登録」とも言います。)
ほとんどのページでは、クロール後にインデックス登録が行われます。
また、Google検索ではコンテンツにアクセスすることなく、ページのインデックスを登録する場合もあり、例えば、ページが robots.txtでブロックされている場合などでもGoogleはインデックス登録を行うことが可能です。
目次
SEOに与える影響
検索エンジンやGoogleにウェブページがインデックス登録されない場合、検索結果に表示されることはありません。
つまり、インデックス登録がなければ、そのウェブページが評価されることもありません。
そのため、インデックスについて知っておくこと、検索エンジンにインデックス登録が行われていることはSEOの初歩であり、とても重要なことだと言えます。
Googleのインデックスを確認する方法
Googleのインデックス登録を確認する方法として2つご紹介します。
正確に、Googleのイデックスを確認したい場合は「Search Consoleで調べる方法」が推奨されます。
Search Consoleで調べる方法
Googleのインデックス登録を確認する方法としては、「Google Search Console」に登録し、対象のページURLを【「URL」内のすべてのURLを検査】に入れて、確認する方法が最も確実にインデックスの判断が可能です。
対象のURLを入力したら、インデックス登録されているかどうかの結果を、以下画像のように表示してくれます。
インデックスが未登録の場合、「インデックス登録をリクエスト」のボタンから、1日20URL程度、知らせることが可能です。
Search Consoleに登録することで、日々のページに対するエラーも確認することが可能なため、登録を行っておきましょう。またエラーへの対処については「インデックス>カバレッジの解説・対象方法」を確認してください。
site:URLでインデックスを調べる方法
以下画像のように、Google検索で「site:URL」を入れて、インデックス登録を確認することが可能です。
対象のURLが表示されれば、インデックス登録されていることになりますが、こちらは100%正確ではありません。
そのため、簡易で調べる方法であることを理解しておきましょう。
Googleにインデックス登録が行われない場合の対処方法
Googleにインデックス登録が行われていない原因としては、以下の内容が考えられます。
1つ1つ詳細を説明していきます。
Search Consoleに登録をして原因を調べる
Search Consoleに登録することで、「なぜGoogleにインデックスされていないか?」という問題の80%以上は解決してくれます。
そのため、まずはSearch Consoleに登録し、データを確認しましょう。エラーへの対処については「インデックス>カバレッジの解説・対象方法」を確認してください。
ウェブマスター向けガイドラインに違反している場合
Googleのウェブマスターガイドラインに違反している場合、インデックス登録が行われません。
品質を逸脱しているケースは少ないですが、
- Google がページを検出できるよう手助けする
- Google がページを理解できるよう手助けする
- 訪問者がページを利用しやすいよう手助けする
上記の3点は必ず確認しておきましょう。
ページの公開期間が浅い場合
ページの公開から長くて3日~7日程度はGoogleにインデックス登録されない可能性があります。
これは、ページの更新頻度によっても変わりますが、Google botが巡回していないため、しばらく待つことが適切です。
どうしてもインデックス登録を早めたい場合のみ、上記のSearch Consoleで調べる方法より「インデックス登録をリクエスト」を行ってください。
ページにnofollow属性が追加されている場合
ページに「nofollow属性」が付与されている場合には、Googleにインデックス登録を拒否している状態となるため、インデックス登録されません。
HTMLのmetaの部分をチェックしましょう。
また、一度「noindex」の設定をページに行っている場合は、Googleのクロール頻度が下がる可能性があります。その場合、上記のSearch Consoleで調べる方法より「インデックス登録をリクエスト」を行ってください。
(noindex キャッシュをGoogleが見ている可能性もあるため、変更後はキャッシュをクリアすることを推奨します。)
可能性は低いですが、「X-Robots-Tag」 で noindex を返している場合も、インデックス登録されません。(参照:X-Robots-Tag HTTP ヘッダーの使用)
robots.txtファイルでブロックしている場合
「robots.txtファイル」で対象のURLをブロックしている場合、Googleにはインデックス登録がされません。
記述間違いによるものが大半を占めるため、確認しておきましょう。
また、robots.txtファイルでブロックした場合でも、Googleの判断によりインデックス登録される場合があり、Search Consoleには「警告」のステータスとして表示されます。
canonicalタグの記述間違い
「canonicalタグ」の記述間違い(指定するURL間違い)でも、インデックス登録が適切に行われない場合があります。
多くの記述間違いの場合、Googleはcanonicalタグを無視してくれますが、指定するURLが現存するURLで指定が間違っている場合は、指定URLで正規化されるため、そのURLにnofollow属性や、何らかの形でGooglebotをブロックしている場合はインデックスされません。
IPアドレス又はユーザーエージェント当でブロックしている場合
「IPアドレス」や「ユーザーエージェント」等でブロックしている場合は、Googlebotがアクセスすることが出来ず、インデックス登録されない可能性があります。
ウェブサイトやサーバーの設定を確認しておきましょう。
サーバーエラー
サーバーの500番台のエラーなどでもGooglebotはページを閲覧できなくなるため、インデックス登録を行うことはできません。
また、Search Consoleでエラーを確認できる部分のため、チェックしておきましょう。
何らかの事情でGoogleがレンダリングできていない場合
ウェブサイト及びウェブページの表示スピードの問題や、CSSや「JavaScript(ジャバスクリプト)」などの問題で、Googlebotが正しく「レンダリング」出来ていない場合、インデックス登録されない可能性があります。
レンダリングを調べる方法として、まず、Search Consoleの【「URL」内のすべてのURLを検査】に入れて、対象のページを確認します。
上画像の「公開URLをテスト」のボタンを押し、以下画像のように「テスト済みのページを表示」で確認します。
以上から「スクリーンショット」や「HTML」を表示することで確認できます。
Googleへのインデックス登録を早める方法
Googleへのインデックス登録を早めるために、以下2つの方法を公式ページ「インデックス登録について」でGoogleは推奨しています。
- XMLサイトマップでGoogleに伝える
- RSSフィード・AtomフィードでGoogleに伝える
新しいURLや更新されたURLをGoogleに送信することで、対象ページの発見が早くなります。
ただし、Googleのインデックス登録を確約するものではありませんので、注意してください。
Googleのインデックスをブロックする方法
Googleのインデックスをブロックするために、Googleに推奨されているのは3つの方法です。
- 「robots.txtファイル」を作成するしブロックする方法
- メタタグ(meta tag)でブロックする方法(nofollow属性)
- HTTP ヘッダーを利用する方法
公式ページの「サイトのコンテンツへのアクセスをブロックする」で詳細の説明が記載されていますので、確認しましょう。
ただし、robots.txtファイルでブロックした場合でもGoogleにインデックス登録される可能性があるため注意しましょう。
また、注意点として「重複するコンテンツ」によりインデックスをブロックしたい場合は、「canonicalタグ」等で正規化する、又は「301リダイレクト」を利用するなどの方法が一般的です。
良くある質問
インデックス(index)において良くある質問をまとめておきます。
正確な期間や時間は分かりません。
一般論として繁盛に更新を行っており、Googleのクローラーが巡回している状態であれば、公開から3時間程度でインデックスされ、作成したばかりのウェブサイトの場合は1日から7日程度かかります。
ただし、ウェブサイトの状況や、XMLサイトマップ、又はRSSフィード・AtomフィードのGoogleへの送信の有無などによって異なります。
正確な期間は分かりません。
一般論として、SEOの効果(上位表示されるまでの期間)は、新しくウェブサイトを作成した場合、3ヶ月~6ヶ月程度時間がかかります。既に運用されているウェブサイトのページの場合でも1ヶ月から3ヶ月程度の時間がかかります。
上位表示されないからと言って諦める必要はなく、SEOのルールを確認したうえで記事やブログなどを更新していきましょう。
著作者:辻 昌彦
コメント・フィードバック
フィードバックいただいた、SEOへのご意見や見解は内容を管理者が確認し、当文章に掲載される可能性がございます。