【Google】重複コンテンツとは?避けるべき理由や対策方法について解説
記載されている内容は2022年02月25日時点のものです。現在の情報と異なる可能性がありますので、ご了承ください。
また、記事に記載されている情報は自己責任でご活用いただき、本記事の内容に関する事項については、専門家等に相談するようにしてください。
初回公開日:2022年02月25日
更新日:2022年03月01日
重複コンテンツとは?
Googleに低品質なコンテンツとして扱われ、サイト評価を下げる要因となるものの1つが「重複コンテンツ」です。重複コンテンツとは、サイト内部に同じようなコンテンツが複数存在することを指します。
また、自社サイトと外部のサイトで同じようなコンテンツが存在しているケースも重複コンテンツをして扱われています。
ここでは重複コンテンツについて解説するため、参考にしてみてください。
同一サイト内に類似したコンテンツがある
重複コンテンツのパターンの1つが、サイト内部に類似したコンテンツが複数存在するというものです。たとえばサイトのURLに「http://」と「https://」など異なるURLが複数存在していた場合、URLを統一することで重複コンテンツが生成されるケースがあります。
また、コンテンツ内部での定型文の繰り返しによって重複が発生するケースもあります。
外部サイトに類似したコンテンツがある
自社サイトの外部に自社のコンテンツと類似したコンテンツが存在するというパターンもあります。これは自社サイトのコンテンツが盗用されているケースや、自社でコンテンツを作成する際にコピーコンテンツを作成してしまったケースなどが考えられます。
既存のコンテンツを盗用することはNGですが、サイトの仕様によって発生してしまう可能性も考えられることから、適切な対処が必要です。
【Google】重複コンテンツの基準
URL自体は異なっていても同じコンテンツを表示するURLが複数ある場合、Googleの基準としては重複コンテンツと認識されます。
また、たとえば重要度が低いWebページなどで「color=green」や「color=red」といったパラメータを使用してバリエーションを作っている場合も、重複コンテンツと認識されるため、クローラーの効率が下がるケースがあります。
【Google】重複コンテンツを避けるべき理由
現在のGoogleのアルゴリズムでは、低品質なコンテンツを提供しているサイトはサイト評価が下がり、検索順位も下がる可能性があります。それでは、低品質なコンテンツとして扱われる重複コンテンツがある場合、具体的にどのようなリスクが考えられるのでしょうか。
ここでは、重複コンテンツを避けるべき理由について解説していきます。
検索結果に表示されなくなる
前述のとおり、重複コンテンツがあるとクローラーの効率が下がります。Googleのクローラーはさまざまなページから情報を収集してデータベースに登録しようとしているため、重複ページはクロールされる可能性が低くなるためです。
また、Google検索ではさまざまな内容のサイトを検索結果に表示することで利便性を向上させようとしているため、類似しているページは検索結果に表示されにくくなっています。
ペナルティの対象になる
外部のコンテンツと類似したページがある場合、コピーコンテンツと判断される可能性があります。検索順位を向上させるために他のサイトのコンテンツを盗用したと判断されれば、ペナルティの対象となるでしょう。
また、コンテンツの数を増やすために類似した内容のコンテンツを複数作成する行為もペナルティの対象になる可能性があります。
被リンクの評価が分散する
サイト内に類似したコンテンツが複数ある場合、それぞれのページへの被リンクの評価が分散されてしまいます。被リンクが分散してしまうことで、Googleからの正しい評価を受けられない可能性があります。
【Google】重複コンテンツの対策方法
重複コンテンツは意図して作成したケースもあれば、偶然生成されてしまったというケースもあるでしょう。いずれにしても検索結果に表示されなくなる可能性があるため、重複コンテンツがあれば適切に対処する必要があります。
ここでは、重複コンテンツの対策方法について解説していきます。
URLの正規化を行う
サイトURLに「www」のあり、なしが混在している場合や、末尾の「index」のあり、なしが混在している場合など、URLが正規化されていないことから重複コンテンツが発生しているケースがあります。
このような場合は、メインとなるURLを1つに決めてURLの正規化を行いましょう。正規化を行う方法としては複数の方法がありますが、HTMLに統一するURLのcanonicalタグを設置するなどの方法があります。
アノテーションの設定をする
アノテーションとは、パソコンやスマートフォン(スマホ)などデバイスごとのURLがあることを検索エンジンに認識させることです。パソコン用サイトとスマホ用サイトでURLが異なっている場合は、アノテーションの設定を行うと良いでしょう。
具体的には、パソコン用のHTMLに「link rel=“alternate”」を記載し、スマホ用の別のURLが存在することを伝えるようにしましょう。また、スマホ用のページにはcanonicalタグを設置することで、パソコン用ページに正規化することも必要です。
定型文の繰り返しを少なくする
テキストの量を増やすために定型文を繰り返したことで、すべてのページに同じ定型文が入っているというケースもあります。重複コンテンツ調査ツールを使って重複度を確認しながら、重複コンテンツだと判定されないようにコンテンツを修正していきましょう。
複数のリンクを使わず一貫性を持たせる
重複コンテンツがサイト内に複数ある場合、内部リンクでは複数のリンクを使用せずに一貫性を保つようにしましょう。
具体的には、コンテンツに対して内部リンクを貼る場合は、重複コンテンツの中のどれか1つをメインのURLとしてリンクするように統一しましょう。
一覧ページも工夫してオリジナルコンテンツにする
既存の記事を一覧で紹介するページの場合、記事の詳細ページの内容をそのまま抜粋していると重複コンテンツとみなされるケースがあります。
このような場合は、一覧ページにも既存記事の内容や紹介文などを付け加えることで重複のないオリジナルコンテンツにしましょう。
トップレベルドメインを認識させる
国別のコンテンツを扱う場合、できるだけトップレベルドメインを使用してGoogleで適切なバージョンの文書が表示されるようにしましょう。
たとえば、トップレベルドメインがドイツの国別コードが含まれている「http://example.de」であるとします。
このトップレベルドメインを利用することで、ディレクトリの「http://example.com/de」やサブドメインの「http://de.example.com」を利用するよりも、ドイツを対象としたコンテンツであることをGoogleに認識してもらいやすくなります。
空ページを非公開にする
テストページや空のページが存在している場合は非公開扱いにしましょう。非公開にする場合は、Googleにインデックスされないように空ページのHTML内のmeta要素に「content=”noindex”」と記述しましょう。
noindexを使用することによってGoogleにインデックスされないようになるため、検索結果にも表示されなくなります。
企業独自の内容を掲載する
外部サイトのコンテンツをコピーして自社サイトで使用している場合は、Googleからのペナルティの対象となります。外部サイトのコピーコンテンツを削除し、自社独自のコンテンツを作成して掲載するようにしましょう。
コピーされている場合は削除申し立てをする
自社サイトのコンテンツが外部サイトに盗用されているというケースもあるでしょう。このように意図せずコンテンツが引用されている場合は、メールや問い合わせフォームなどからサイトの運営者へ削除の申し立てを行いましょう。
サイト運営者への申し立てによって削除が行われた場合は問題ありませんが、連絡が取れない場合はGoogleサーチコンソールから著作権侵害による削除リクエストフォームを使ってGoogleに申し立てを行うという方法もあります。
301リダイレクトでサイトを適切に移転する
301リダイレクトを行うことで、メインのURL以外のページを移転したという扱いにすることが可能です。前述のようにURLが正規化されておらず、ユーザーにとっても複数のURLが必要ないケースであれば301リダイレクトを行うと良いでしょう。
301リダイレクトを行えば、前のページの評価も引き継ぐことが可能なため、SEO的にも効果があります。
URLまで削除する
サイト内に類似したコンテンツが複数ある場合は、不要なものを削除してしまうという方法もあります。
しかし、削除まではしたくないという場合であれば、前述のとおりHTML内に「content=”noindex”」を記述してクロールされないようにすると良いでしょう。
【Google】重複コンテンツに当たるか調べる方法
重複コンテンツがあった場合は適切な対処を行うことが大切ですが、そもそも重複コンテンツがあるのかどうか調べる方法がわからないという場合もあるでしょう。
また、内容の似ているコンテンツがあったとしても、重複コンテンツと判断する方法がわからないという場合もあるのではないでしょうか。ここでは最後に、重複コンテンツに当たるか調べる方法について解説していきます。
Google検索エンジンで調べる
Google検索エンジンで自社のコンテンツの内容を検索すれば、外部でコピーしているサイトがないかどうか調べることができます。自社サイト以外のサイトが上位表示された場合、重複コンテンツと見なされていると判断できるでしょう。
また、この方法で調べる場合はシークレットモードで検索すると良いでしょう。シークレットモードであれば、過去に閲覧したページなどに左右されずに検索できます。
Google Search Consoleの「HTMLの改善」を利用する
Google Search Consoleにある「HTMLの改善」から重複するメタデータやタイトルタグをチェックすることができます。「重複するメタデータ」と「タイトルタグの重複」に問題が上がってきていないかどうか確認してみると良いでしょう。
コピペチェックツールを利用する
重複コンテンツの可能性があるページが見つかった場合は、コピペチェックツールを利用して重複度を確認すると良いでしょう。また、対応が必要なコンテンツが複数ある場合もツールを活用して対応の優先度を決めると良いでしょう。
重複コンテンツはGoogleでペナルティに該当するため注意しよう
自社サイト内に重複コンテンツがあった場合、SEOにもさまざまな悪い影響が出る可能性があります。そのため、意図的にコピーコンテンツを作成した場合はもちろん、偶然発生してしまった重複コンテンツにも気を付けたいと言えるでしょう。
本記事で紹介した重複コンテンツを避けるべき理由や対策方法などを参考に、重複コンテンツに対して適切な対処を行えるようにしましょう。