重複するコンテンツ

重複するコンテンツとは、ドメインに限らず、他のコンテンツと完全に同じ、又は非常によく似たコンテンツの集合体のことを言います。

重複コンテンツは、意図的に他人のコンテンツを偽装したものではなく、ウェブサイト運営時等に重複してしまうページ・コンテンツ、PC版とSP版のURLが違う場合の重複、複数の異なるURLで表示又はリンクされる商品、印刷用バージョンのコンテンツなどを指しています。

重複するコンテンツは「canonicalタグ」でページの正規化、又は「301リダイレクト」「noindex メタタグ」を以下の時に利用します。

  • canonicalタグ:主に表示すべき重複するページで利用
  • 301リダイレクト:主にサイトの構造を変更・更新し、ユーザーに必要ないページに利用
  • noindex:Wordファイル、PDFファイルや他のドメインのサイトなど

注意点としては、コンテンツが重複しているからと言って「robots.txt」ファイルなどを利用してGooglebotのクロールを禁止することは推奨されていません。

また、ウェブサイト内の類似するコンテンツも「重複するコンテンツ」とGoogleに見なされる場合があります。その場合は、

以上の方法が推奨されます。

SEOに与える影響

この重複コンテンツがあるとGoogleが認識した場合、Googleはいずれか一方を選択して登録(インデックス)します。

(もう一方のコンテンツはインデックスされない可能性が高いと言えます。)

重複するコンテンツがあった場合、

  1. Googleがコンテンツを見つける(インデックス)することを遅延させる可能性がある
  2. 類似するコンテンツが多い場合は、Googleのランク付けに問題が発生する
  3. ランク付けするページの能力が低下する可能性がある

以上のような問題が出る可能性がある。

そのため、重複するコンテンツは検索エンジンに問題を引き起こす可能性があり、SEOに影響があると言えます。

偽造行為は重複するコンテンツではありません

Googleは多くの場合、重複は偽装を意図したものではないと伝えていますが、偽造行為(悪意がある重複コンテンツ)を行った場合は、Googleの検索結果から除外されます。

他人のコンテンツをコピーする行為は著作権に違反する行為であり、これは重複するコンテンツではありません。

偽造行為は「コピーされたコンテンツ」を詳しく確認しておきましょう。

主な重複するコンテンツのパターン

  • HTTPとHTTPSのページ(301リダイレクト)
  • WWWと非WWWのページ(301リダイレクト)
  • パラメーターが付与されているページ(canonicalタグ or パラメーター処理ツール)
  • ページネーション」の1ページ目のページ(canonicalタグ)
  • 他サイトなどで利用している製品・商品ページ(canonicalタグ or noindex)
  • 印刷用バージョンのコンテンツ(canonicalタグ)
  • SP版とPC版のURLが違うウェブページ(canonicalタグ)
  • .htmlと非.htmlのURLが付与されているページ(301リダイレクト)
  • Wordファイル、PDFファイルなどがコンテンツと重複している場合(noindex)

※パラメーター処理ツールは「Search Console」の機能です。

以上のようなページが重複するコンテンツになってしまう可能性があるため、注意しましょう。

重複するコンテンツを確認する方法

重複するコンテンツは、Search Consoleの「ガバレッジ>除外(チェック)>「重複しています。送信された URL が正規 URL として選択されていません」からチェックすることが可能です。

重複するコンテンツを確認する方法

「重複しています。送信された URL が正規 URL として選択されていません」に該当した場合、「重複するページがあり、そのどのページも正規ページとして指定されていません。」という意味になります。

URLをチェックしましょう。

また、稀に「重複しています。Google により、ユーザーがマークしたページとは異なるページが正規ページとして選択されました」と表示される場合もあります。

この場合は、「あるページセットの正規ページとして指定されていますが、Google は別の URL のほうが正規ページとして適切と判断しています。」という意味です。

いずれの場合も、確認しておきましょう。

良くある質問

重複するコンテンツに関しての良くある質問です。

いいえ、ペナルティ(手動による対策)ではありません。

ただし、重複するコンテンツはSEOに悪影響を及ぼす可能性があります。

既に重複しているコンテンツが存在している場合、削除は適切な対応ではありません。

301リダイレクトを活用して、1つのページにまとめましょう。

はい、ただし場合と出来る場合と確認できないがあります。Googleが類似している(重複している)と認識した重複するコンテンツのみ確認することが可能です。

例えば、以下のような2つのタイトルが同じウェブサイトに合った場合、

  • タイトル:「初心者が行うSEO」・・・「SEO」のキーワードで100位
  • タイトル:「初心者がSEOを自分で行う方法」・・・「SEO」のキーワードで50位

類似するコンテンツに当たる可能性がありますが、Googleがすでに両ページともランク付けしているため、Search Consoleの重複には表示されません。

上記は「類似するコンテンツ」ではなく「重複したコンテンツ間違い」となり、まとめるのであれば、301リダイレクトで1つのページにまとめ、内容が違うのであれば、改めて両方のページ内容やタイトルを見直すことを推奨します。

コメント・質問・ご意見など

guest
0 コメント
Inline Feedbacks
View all comments
重複するコンテンツ

重複するコンテンツとは?

重複するコンテンツとは、ドメインに限らず、他のコンテンツと完全に同じ、又は非常によく似たコンテンツの集合体のことを言う。多くの場合意図的に行われたことではなく、ウェブサイト運営時に重複してしまうページ・コンテンツを指す。

コンテンツが重複した場合、canonicalタグを利用しページを正規化する。ただし、サイトの構造を変更し、重複するコンテンツとなった場合は301リダイレクトを利用する。

重複コンテンツがあるとGoogleが認識した場合、Googleはいずれか一方を選択してインデックス登録する。ただし、重複するコンテンツは検索エンジンに問題を引き起こす可能性があり、SEOに影響があると言える。

SEOベストプラクティス
  • canonicalタグ、又は301リダイレクトを利用する
  • 類似するコンテンツは1つのページにまとめるか、オリジナルコンテンツを追加する
  • Wordファイル、PDFファイルで重複する場合はnoindexを利用する