「重複するコンテンツ」の版間の差分

提供:SEO百科事典
(ページの作成:「Googleが伝える(又はSEOにおいて)重複するコンテンツとは、ドメインに限らず、他のコンテンツと完全に同じ、又は非常によく似たコンテンツの集合体のことを言う。 重複コンテンツは、'''意図的に他人のコンテンツを偽装したものではなく'''、ウェブサイト運営時等に重複してしまうページ、PC版とSP版のURLが違う場合の重複、複数の異なるURLで…」)
 
編集の要約なし
 
(同じ利用者による、間の7版が非表示)
9行目: 9行目:
正規のバージョンを指定(URLの正規化)することで、主に表示すべき重複するコンテンツで利用する。
正規のバージョンを指定(URLの正規化)することで、主に表示すべき重複するコンテンツで利用する。


==== 重複するコンテンツに対するcanonicalタグの例 ====
* パラメーターが付与されているページ(canonicalタグ or パラメーター処理ツール※)
 
* 「[[ページネーション]]」の1ページ目のページ(canonicalタグ)
* パラメーターが付与されているページ(canonicalタグ or パラメーター処理ツール)
* 「ページネーション」の1ページ目のページ(canonicalタグ)
* 他サイトなどで利用している製品・商品ページ(canonicalタグ or noindex)
* 他サイトなどで利用している製品・商品ページ(canonicalタグ or noindex)
* 印刷用バージョンのコンテンツ(canonicalタグ)
* 印刷用バージョンのコンテンツ(canonicalタグ)
* SP版とPC版のURLが違うURL・ウェブページ(canonicalタグ)
* SP版とPC版のURLが違うURL・ウェブページ(canonicalタグ)
※パラメーター処理ツールは「[[Google Search Console]]」の機能。


=== 301リダイレクトの実行 ===
=== 301リダイレクトの実行 ===
主にサイトの構造を変更・更新し、ユーザーに必要ないページに重複するコンテンツを避けるため301リダイレクトを利用する。
主にサイトの構造を変更・更新し、ユーザーに必要ないページに重複するコンテンツを避けるため301リダイレクトを利用する。
==== 重複するコンテンツに対する301リダイレクト例 ====


* httpとhttpsのページ(301リダイレクト)
* httpとhttpsのページ(301リダイレクト)
26行目: 23行目:
* .htmlと非.htmlのURLが付与されているページ(301リダイレクト)
* .htmlと非.htmlのURLが付与されているページ(301リダイレクト)


noindex属性
=== noindexメタタグを活用する ===
Wordファイル、PDFファイルや他のドメインのサイトが重複している場合に[[noindex]]メタタグを活用する。
 
* 他サイトなどで利用している製品・商品ページ(canonicalタグ or noindex)
* Wordファイル、PDFファイルなどがコンテンツと重複している場合(noindex)
 
=== 注意点 ===
コンテンツが重複しているため、「[[robots.txt]]」ファイルなどを利用して[[Googlebot]]の[[クロール]]を禁止することは推奨されていない。
 
 
また、ウェブサイト内の類似するコンテンツも「重複するコンテンツ」とGoogleに見なされる場合があり、以下の対処方法が推奨される。
 
* 各ページに「[[オリジナルコンテンツ]]」を追加する
* 各ページを1つにまとめる(301リダイレクト推奨)
 
== SEOに与える影響 ==
 
=== 重複するコンテンツがある場合 ===
ウェブサイト上に重複するコンテンツがある場合、以下のような問題が出る可能性がある。
 
# Googleがコンテンツを見つける([[インデックス]])することを遅延させる可能性
# 類似するコンテンツが多い場合は、Googleのランク付けに問題が発生する可能性
# ランク付けするページの能力が低下する可能性
 
=== 偽造行為(悪意がある重複コンテンツ)の場合 ===
Googleは多くの場合、重複するコンテンツは偽装を意図したものではないと伝えている。
 
しかし、偽造行為(悪意がある重複するコンテンツ)を行った場合は、Googleの検索結果から除外される。
 
他人のコンテンツをコピーする行為は著作権に違反する行為であり、これは重複するコンテンツではなく、「[[コピーされたコンテンツ]]」となる。
 
== 確認方法 ==
 
=== 重複するコンテンツを確認する方法 ===
[[ファイル:Sa-tikonsoru01.png|代替文=重複するコンテンツを確認する方法(Google Search Console)|サムネイル|重複するコンテンツを確認する方法(Google Search Console)]]
重複するコンテンツは、Google Search Consoleの「ガバレッジ>除外(チェック)>「重複しています。送信された URL が正規 URL として選択されていません」からチェックすることが可能。
 
「重複しています。送信された URL が正規 URL として選択されていません」に該当した場合、「重複するページがあり、そのどのページも正規ページとして指定されていません。」という意味になる。
 
また、稀に「重複しています。Google により、ユーザーがマークしたページとは異なるページが正規ページとして選択されました」と表示される場合もある。
 
この場合は、「あるページセットの正規ページとして指定されているが、Google は別の URL のほうが正規ページとして適切と判断している。」という意味。
 
== 良くある質問 ==


* canonicalタグ:
=== 重複するコンテンツはペナルティか? ===
* 301リダイレクト:主にサイトの構造を変更・更新し、ユーザーに必要ないページに利用
ペナルティ([[手動による対策]])ではない。
* noindex:Wordファイル、PDFファイルや他のドメインのサイトなど


注意点としては、コンテンツが重複しているからと言って「robots.txt」ファイルなどを利用してGooglebotのクロールを禁止することは推奨されていません。
ただし、重複するコンテンツはSEOに悪影響を及ぼす可能性がある。


また、ウェブサイト内の類似するコンテンツも「重複するコンテンツ」とGoogleに見なされる場合があります。その場合は、
=== 重複するコンテンツを削除(404)しても良いか? ===
既に重複するコンテンツがウェブサイト内に存在している場合、削除は適切な対応ではない。


* 各ページに「オリジナルコンテンツ」を追加する
ページの種類に合わせ、canonicalタグの利用、301リダイレクトの実行、noindexメタタグの活用が推奨される。
* 各ページを1つにまとめる


以上の方法が推奨されます。
[[Category:SEOコンテンツ・品質等]]

2023年3月20日 (月) 18:11時点における最新版

Googleが伝える(又はSEOにおいて)重複するコンテンツとは、ドメインに限らず、他のコンテンツと完全に同じ、又は非常によく似たコンテンツの集合体のことを言う。

重複コンテンツは、意図的に他人のコンテンツを偽装したものではなく、ウェブサイト運営時等に重複してしまうページ、PC版とSP版のURLが違う場合の重複、複数の異なるURLで表示又はリンクされる商品、印刷用バージョンのコンテンツ等となる。

SEOのベストプラクティス

重複するコンテンツは「canonicalタグ」でページの正規化、又は「301リダイレクト」「noindex メタタグ」を以下の時に利用する。

canonicalタグの利用

正規のバージョンを指定(URLの正規化)することで、主に表示すべき重複するコンテンツで利用する。

  • パラメーターが付与されているページ(canonicalタグ or パラメーター処理ツール※)
  • ページネーション」の1ページ目のページ(canonicalタグ)
  • 他サイトなどで利用している製品・商品ページ(canonicalタグ or noindex)
  • 印刷用バージョンのコンテンツ(canonicalタグ)
  • SP版とPC版のURLが違うURL・ウェブページ(canonicalタグ)

※パラメーター処理ツールは「Google Search Console」の機能。

301リダイレクトの実行

主にサイトの構造を変更・更新し、ユーザーに必要ないページに重複するコンテンツを避けるため301リダイレクトを利用する。

  • httpとhttpsのページ(301リダイレクト)
  • wwwと非wwwのページ(301リダイレクト)
  • .htmlと非.htmlのURLが付与されているページ(301リダイレクト)

noindexメタタグを活用する

Wordファイル、PDFファイルや他のドメインのサイトが重複している場合にnoindexメタタグを活用する。

  • 他サイトなどで利用している製品・商品ページ(canonicalタグ or noindex)
  • Wordファイル、PDFファイルなどがコンテンツと重複している場合(noindex)

注意点

コンテンツが重複しているため、「robots.txt」ファイルなどを利用してGooglebotクロールを禁止することは推奨されていない。


また、ウェブサイト内の類似するコンテンツも「重複するコンテンツ」とGoogleに見なされる場合があり、以下の対処方法が推奨される。

SEOに与える影響

重複するコンテンツがある場合

ウェブサイト上に重複するコンテンツがある場合、以下のような問題が出る可能性がある。

  1. Googleがコンテンツを見つける(インデックス)することを遅延させる可能性
  2. 類似するコンテンツが多い場合は、Googleのランク付けに問題が発生する可能性
  3. ランク付けするページの能力が低下する可能性

偽造行為(悪意がある重複コンテンツ)の場合

Googleは多くの場合、重複するコンテンツは偽装を意図したものではないと伝えている。

しかし、偽造行為(悪意がある重複するコンテンツ)を行った場合は、Googleの検索結果から除外される。

他人のコンテンツをコピーする行為は著作権に違反する行為であり、これは重複するコンテンツではなく、「コピーされたコンテンツ」となる。

確認方法

重複するコンテンツを確認する方法

重複するコンテンツを確認する方法(Google Search Console)
重複するコンテンツを確認する方法(Google Search Console)

重複するコンテンツは、Google Search Consoleの「ガバレッジ>除外(チェック)>「重複しています。送信された URL が正規 URL として選択されていません」からチェックすることが可能。

「重複しています。送信された URL が正規 URL として選択されていません」に該当した場合、「重複するページがあり、そのどのページも正規ページとして指定されていません。」という意味になる。

また、稀に「重複しています。Google により、ユーザーがマークしたページとは異なるページが正規ページとして選択されました」と表示される場合もある。

この場合は、「あるページセットの正規ページとして指定されているが、Google は別の URL のほうが正規ページとして適切と判断している。」という意味。

良くある質問

重複するコンテンツはペナルティか?

ペナルティ(手動による対策)ではない。

ただし、重複するコンテンツはSEOに悪影響を及ぼす可能性がある。

重複するコンテンツを削除(404)しても良いか?

既に重複するコンテンツがウェブサイト内に存在している場合、削除は適切な対応ではない。

ページの種類に合わせ、canonicalタグの利用、301リダイレクトの実行、noindexメタタグの活用が推奨される。