重複するコンテンツ
Googleが伝える(又はSEOにおいて)重複するコンテンツとは、ドメインに限らず、他のコンテンツと完全に同じ、又は非常によく似たコンテンツの集合体のことを言う。
重複コンテンツは、意図的に他人のコンテンツを偽装したものではなく、ウェブサイト運営時等に重複してしまうページ、PC版とSP版のURLが違う場合の重複、複数の異なるURLで表示又はリンクされる商品、印刷用バージョンのコンテンツ等となる。
SEOのベストプラクティス
重複するコンテンツは「canonicalタグ」でページの正規化、又は「301リダイレクト」「noindex メタタグ」を以下の時に利用する。
canonicalタグの利用
正規のバージョンを指定(URLの正規化)することで、主に表示すべき重複するコンテンツで利用する。
- パラメーターが付与されているページ(canonicalタグ or パラメーター処理ツール※)
- 「ページネーション」の1ページ目のページ(canonicalタグ)
- 他サイトなどで利用している製品・商品ページ(canonicalタグ or noindex)
- 印刷用バージョンのコンテンツ(canonicalタグ)
- SP版とPC版のURLが違うURL・ウェブページ(canonicalタグ)
※パラメーター処理ツールは「Google Search Console」の機能。
301リダイレクトの実行
主にサイトの構造を変更・更新し、ユーザーに必要ないページに重複するコンテンツを避けるため301リダイレクトを利用する。
- httpとhttpsのページ(301リダイレクト)
- wwwと非wwwのページ(301リダイレクト)
- .htmlと非.htmlのURLが付与されているページ(301リダイレクト)
noindexメタタグを活用する
Wordファイル、PDFファイルや他のドメインのサイトが重複している場合にnoindexメタタグを活用する。
- 他サイトなどで利用している製品・商品ページ(canonicalタグ or noindex)
- Wordファイル、PDFファイルなどがコンテンツと重複している場合(noindex)
注意点
コンテンツが重複しているため、「robots.txt」ファイルなどを利用してGooglebotのクロールを禁止することは推奨されていない。
また、ウェブサイト内の類似するコンテンツも「重複するコンテンツ」とGoogleに見なされる場合があり、以下の対処方法が推奨される。
- 各ページに「オリジナルコンテンツ」を追加する
- 各ページを1つにまとめる(301リダイレクト推奨)
SEOに与える影響
重複するコンテンツがある場合
ウェブサイト上に重複するコンテンツがある場合、以下のような問題が出る可能性がある。
- Googleがコンテンツを見つける(インデックス)することを遅延させる可能性
- 類似するコンテンツが多い場合は、Googleのランク付けに問題が発生する可能性
- ランク付けするページの能力が低下する可能性
偽造行為(悪意がある重複コンテンツ)の場合
Googleは多くの場合、重複するコンテンツは偽装を意図したものではないと伝えている。
しかし、偽造行為(悪意がある重複するコンテンツ)を行った場合は、Googleの検索結果から除外される。
他人のコンテンツをコピーする行為は著作権に違反する行為であり、これは重複するコンテンツではなく、「コピーされたコンテンツ」となる。
確認方法
重複するコンテンツを確認する方法
重複するコンテンツは、Google Search Consoleの「ガバレッジ>除外(チェック)>「重複しています。送信された URL が正規 URL として選択されていません」からチェックすることが可能。
「重複しています。送信された URL が正規 URL として選択されていません」に該当した場合、「重複するページがあり、そのどのページも正規ページとして指定されていません。」という意味になる。
また、稀に「重複しています。Google により、ユーザーがマークしたページとは異なるページが正規ページとして選択されました」と表示される場合もある。
この場合は、「あるページセットの正規ページとして指定されているが、Google は別の URL のほうが正規ページとして適切と判断している。」という意味。
良くある質問
重複するコンテンツはペナルティか?
ペナルティ(手動による対策)ではない。
ただし、重複するコンテンツはSEOに悪影響を及ぼす可能性がある。
重複するコンテンツを削除(404)しても良いか?
既に重複するコンテンツがウェブサイト内に存在している場合、削除は適切な対応ではない。
ページの種類に合わせ、canonicalタグの利用、301リダイレクトの実行、noindexメタタグの活用が推奨される。