重複するコンテンツ
Googleが伝える(又はSEOにおいて)重複するコンテンツとは、ドメインに限らず、他のコンテンツと完全に同じ、又は非常によく似たコンテンツの集合体のことを言う。
重複コンテンツは、意図的に他人のコンテンツを偽装したものではなく、ウェブサイト運営時等に重複してしまうページ、PC版とSP版のURLが違う場合の重複、複数の異なるURLで表示又はリンクされる商品、印刷用バージョンのコンテンツ等となる。
SEOのベストプラクティス
重複するコンテンツは「canonicalタグ」でページの正規化、又は「301リダイレクト」「noindex メタタグ」を以下の時に利用する。
canonicalタグの利用
正規のバージョンを指定(URLの正規化)することで、主に表示すべき重複するコンテンツで利用する。
重複するコンテンツに対するcanonicalタグの例
- パラメーターが付与されているページ(canonicalタグ or パラメーター処理ツール)
- 「ページネーション」の1ページ目のページ(canonicalタグ)
- 他サイトなどで利用している製品・商品ページ(canonicalタグ or noindex)
- 印刷用バージョンのコンテンツ(canonicalタグ)
- SP版とPC版のURLが違うURL・ウェブページ(canonicalタグ)
301リダイレクトの実行
主にサイトの構造を変更・更新し、ユーザーに必要ないページに重複するコンテンツを避けるため301リダイレクトを利用する。
重複するコンテンツに対する301リダイレクト例
- httpとhttpsのページ(301リダイレクト)
- wwwと非wwwのページ(301リダイレクト)
- .htmlと非.htmlのURLが付与されているページ(301リダイレクト)
noindex属性
- canonicalタグ:
- 301リダイレクト:主にサイトの構造を変更・更新し、ユーザーに必要ないページに利用
- noindex:Wordファイル、PDFファイルや他のドメインのサイトなど
注意点としては、コンテンツが重複しているからと言って「robots.txt」ファイルなどを利用してGooglebotのクロールを禁止することは推奨されていません。
また、ウェブサイト内の類似するコンテンツも「重複するコンテンツ」とGoogleに見なされる場合があります。その場合は、
- 各ページに「オリジナルコンテンツ」を追加する
- 各ページを1つにまとめる
以上の方法が推奨されます。