自動生成されたコンテンツ
自動生成されたコンテンツとは、プログラムによって作成されたコンテンツのことを言い、Google検索では、品質に関するガイドラインで禁止事項に挙げています。
主に、自動生成されたコンテンツはGoogle等の検索エンジンにおいて、検索ランキングを操作する目的で生成されていることが一般的で、以下のようなコンテンツを指します。
- RSSフィード・Atomフィード から取得したコンテンツをつなぎ合わせただけの組み合わせ(意味のない「キュレーションサイト」)
- 検索結果やRSSフィード・Atomフィードから無断複製によって生成されたテキスト
- 翻訳ツールで人の手によるチェックや編集を行わずに公開されたコンテンツ
- 複数のウェブページを十分な付加価値を与えずに組み合わせたコンテンツ
- 自動化された類義語生成や難読化の手法を使用して生成されたテキスト
- 検索キーワードを含んでいるが、文章としては意味をなさないテキスト
- 「マルコフ連鎖」などの自動処理によって生成されたテキスト
以上のことをGoogleは例として挙げています。
SEOに与える影響
自動生成されたコンテンツがウェブサイト内、又はウェブページを作成した場合、Google検索では「ユーザーの役に立たないコンテンツに対し処置を取る」と解説しており、「手動による対策(ペナルティ)」が与えられるケースや、検索結果から除外されるケースがあるため、必ず行わないようにしましょう。
また、何らかの処置に該当しない場合でも、低品質のページを大量に生産することとなり、ウェブページの評価、及びウェブサイトの全体的な評価は向上することはありません。
さらに、Google検索の日本版では、2017年2月に公開された「日本語検索の品質向上にむけて」で、検索結果のより上位に自ページを表示させることに主眼を置く、品質の低いサイトの順位が下げるアルゴリズムをアップデートしています。
Googleの回答
日本Googleの金谷氏が、Twitterでコンテンツの自動生成について、以下画像のように説明しています。
ページのリンクは「コンテンツの自動生成」を紹介しているページに飛びます。
良くある質問
自動生成されたコンテンツに関する良くある質問を掲載しています。
翻訳されたコンテンツは、人の手を加え編集していることや、オリジナルの要素がプラスされていれば違反にはなりません。また、例えば、英語を日本に翻訳した場合でも、「重複するコンテンツ」にもなりません。(2011年のGoogleマッツ・カット氏のYouTubeより)
英語などをコピーし、そのまま翻訳ツール等に投げ込み、言語を自動翻訳する以外は何もしないなどのページが違反(スパム)の対象となります。
違反しなければ問題ないです。
キュレーションサイトは、ただつなぎ合わせたコンテンツや、無断で取得したコンテンツなどのキュレーションは違反の対象となります。そのため、独自の要素(オリジナルコンテンツ)を入れた者や、許可を得てキュレーションしているものに関しては、違反にはなりません。
ただ、多くのキュレーションサイトはGoogleの検索結果から消える、又は順位が低下しているので、ご検討ください。
「重複するコンテンツ」はウェブサイト全体の重複コンテンツを含み、他のサイトから取得したコンテンツも重複になります。
一方、自動生成されたコンテンツは、重複ではなく自動で生成されたコンテンツが対象となっています。
著作者:辻 昌彦
コメント・フィードバック
フィードバックいただいた、SEOへのご意見や見解は内容を管理者が確認し、当文章に掲載される可能性がございます。