重複するコンテンツ

提供:SEO百科事典
2023年2月27日 (月) 13:42時点におけるMasahiko Tsuji (トーク | 投稿記録)による版 (→‎確認方法)

Googleが伝える(又はSEOにおいて)重複するコンテンツとは、ドメインに限らず、他のコンテンツと完全に同じ、又は非常によく似たコンテンツの集合体のことを言う。

重複コンテンツは、意図的に他人のコンテンツを偽装したものではなく、ウェブサイト運営時等に重複してしまうページ、PC版とSP版のURLが違う場合の重複、複数の異なるURLで表示又はリンクされる商品、印刷用バージョンのコンテンツ等となる。

SEOのベストプラクティス

重複するコンテンツは「canonicalタグ」でページの正規化、又は「301リダイレクト」「noindex メタタグ」を以下の時に利用する。

canonicalタグの利用

正規のバージョンを指定(URLの正規化)することで、主に表示すべき重複するコンテンツで利用する。

  • パラメーターが付与されているページ(canonicalタグ or パラメーター処理ツール※)
  • 「ページネーション」の1ページ目のページ(canonicalタグ)
  • 他サイトなどで利用している製品・商品ページ(canonicalタグ or noindex)
  • 印刷用バージョンのコンテンツ(canonicalタグ)
  • SP版とPC版のURLが違うURL・ウェブページ(canonicalタグ)

※パラメーター処理ツールは「Google Search Console」の機能。

301リダイレクトの実行

主にサイトの構造を変更・更新し、ユーザーに必要ないページに重複するコンテンツを避けるため301リダイレクトを利用する。

  • httpとhttpsのページ(301リダイレクト)
  • wwwと非wwwのページ(301リダイレクト)
  • .htmlと非.htmlのURLが付与されているページ(301リダイレクト)

noindexメタタグを活用する

Wordファイル、PDFファイルや他のドメインのサイトが重複している場合にnoindexメタタグを活用する。

  • 他サイトなどで利用している製品・商品ページ(canonicalタグ or noindex)
  • Wordファイル、PDFファイルなどがコンテンツと重複している場合(noindex)

注意点

コンテンツが重複しているため、「robots.txt」ファイルなどを利用してGooglebotクロールを禁止することは推奨されていない。


また、ウェブサイト内の類似するコンテンツも「重複するコンテンツ」とGoogleに見なされる場合があり、以下の対処方法が推奨される。

  • 各ページに「オリジナルコンテンツ」を追加する
  • 各ページを1つにまとめる(301リダイレクト推奨)

SEOに与える影響

重複するコンテンツがある場合

ウェブサイト上に重複するコンテンツがある場合、以下のような問題が出る可能性がある。

  1. Googleがコンテンツを見つける(インデックス)することを遅延させる可能性
  2. 類似するコンテンツが多い場合は、Googleのランク付けに問題が発生する可能性
  3. ランク付けするページの能力が低下する可能性

偽造行為(悪意がある重複コンテンツ)の場合

Googleは多くの場合、重複するコンテンツは偽装を意図したものではないと伝えている。

しかし、偽造行為(悪意がある重複するコンテンツ)を行った場合は、Googleの検索結果から除外される。

他人のコンテンツをコピーする行為は著作権に違反する行為であり、これは重複するコンテンツではなく、「コピーされたコンテンツ」となる。

確認方法

重複するコンテンツを確認する方法

重複するコンテンツを確認する方法(Google Search Console)
重複するコンテンツを確認する方法(Google Search Console)

重複するコンテンツは、Google Search Consoleの「ガバレッジ>除外(チェック)>「重複しています。送信された URL が正規 URL として選択されていません」からチェックすることが可能。

「重複しています。送信された URL が正規 URL として選択されていません」に該当した場合、「重複するページがあり、そのどのページも正規ページとして指定されていません。」という意味になる。

また、稀に「重複しています。Google により、ユーザーがマークしたページとは異なるページが正規ページとして選択されました」と表示される場合もある。

この場合は、「あるページセットの正規ページとして指定されているが、Google は別の URL のほうが正規ページとして適切と判断している。」という意味。