インデックスがなかなかされないという経験はありますか?
2020年の10月ごろから2021年の1月ごろまで、googleのインデックスが遅くなった気がします。この時期はおそらくサーチコンソールからのインデックス申請機能が閉鎖されていた時期でもあり何かしらのインデックスに関する改修があったためインデックスクローラの機能自体が一部抑えられていた可能性があります。

この期間以外でもインデックスがなかなかされなくて困っているという人はこの記事を参考にしてもらえればうれしいです。

インデックスの仕組み

前述しましたが、リンクを辿ってインデックスクローラーはインデックスをします。
正確に言うと、インデックスクローラーはそのページをまずはリスト化し、その後にそのリストのURLをクロールします。

そのため、そのリストのURLが無くならないといつまでもクロールしてしまいます。

インデックスが進まない原因

インデックスがなかなかされない理由としていくつかの理由があります。インデックスがいつまでたってもされない時は、以下の点を疑ってみてください。

  • 内部・外部リンク導線がつながっていない
  • noindexタグやcanonicalタグを誤って記載してしまっている
  • ページが低品質、または類似ページが存在している
  • 大量のページを旧ページから引継いでいない

内部・外部リンク導線がつながっていない

googleのインデックスクローラーは、リンク導線を辿って移動します。あるページを作成したが、そのページに対してのリンク導線が存在しない場合、クローラーは辿りつくことが出来ません。必ず新規ページを作成したら内部リンク導線を設置してください。

また、上図は内部リンクの場合ですが、内部がつながっていなくても、外部サイトからつながっていればインデックスは基本的にされるはずです。もちろんのことながら、その外部サイトはインデックスされていて低品質コンテンツではないことが必須となります。

noindexタグやcanonicalタグを誤って記載してしまっている

うっかりやってしまいがちなのがnoindexタグの消し漏れcanonicalタグの設定URLが誤っているパターンです。
前者は、テスト環境時に使っていたnoindexタグをそのままにして本番にローンチ、そしてそのままにしてしまったというものです。いまだに人的ミスなことなので見られる失敗です。
後者は、共通ヘッダーを使っていて、canonicalタグで指定しているURLがすべて同一となってしまっているというものがたまに見られます。
この場合、すべてのURLの正しいものが特定のURLということになるため、もちろんインデックスは1つのURLしかされなくなってしまいます。

<link rel=”canonical” href=”https://www.sample.com/”> このような指定URLを全てのページに書いてしまうと、書かれたページの正しいURLは「https://www.sample.com/」です。
ということになってしまいます。
まずは、ヘッダー情報を確認しましょう。

ページが低品質、または類似ページが存在している

品質は、ここ5年ぐらいの間に最も言及される項目です。
サーチコンソールで 「クロール済み-未登録」 になるのもこれが大きな原因です。
「低品質コンテンツ=ユーザーにとって必要のない、有益でないコンテンツ」
ということになります。また他のページと類似や全く同じコピーのようなページももちろん必要ないでしょう。
さて、低品質コンテンツとは言うものの、具体的にどんなコンテンツが該当するのか定量的に表現はできません。よってあいまいではありますがgoogleからは以下のヒントが提示されています。
以下の質問・条件に対してしっかりと回答できるようなコンテンツであるかがカギとなります。

  1. あなたはこの記事に書かれている情報を信頼するか?
  2. この記事は専門家またはトピックについて熟知している人物が書いたものか? それとも素人によるものか?
  3. サイト内に同一または類似のトピックについて、キーワードがわずかに異なるだけの類似の記事や完全に重複する記事が存在しないか?
  4. あなたはこのサイトにクレジット カード情報を安心して提供できるか?
  5. この記事にスペルミス、文法ミス、事実に関する誤りはないか?
  6. このサイトで取り扱われているトピックは、ユーザーの興味に基いて選択されたものか?それとも検索エンジンのランキング上位表示を目的として選択されたものか?
  7. この記事は独自のコンテンツや情報、レポート、研究、分析などを提供しているか?
  8. 同じ検索結果で表示される他のページと比較して、はっきりした価値を持っているか?
  9. コンテンツはきちんと品質管理されているか?
  10. この記事は物事の両面をとらえているか?
  11. このサイトは、そのトピックに関して第一人者(オーソリティ)として認識されているか?
  12. 次のような理由で個々のページやサイトに対してしっかりと手がかけられていない状態ではないか?
  13. コンテンツが外注などにより量産されている
  14. 多くのサイトにコンテンツが分散されている
  15. 記事はしっかりと編集されているか? それとも急いで雑に作成されたものではないか?
  16. 健康についての検索に関し、あなたはこのサイトの情報を信頼できるか?
  17. サイトの名前を聞いたときに、信頼できるソースだと認識できるか?
  18. 記事が取り上げているトピックについて、しっかりと全体像がわかる説明がなされているか?
  19. 記事が、あたりまえのことだけでなく、洞察に富んだ分析や興味深い情報を含んでいるか?
  20. ブックマークしたり、友人と共有したり、友人にすすめたくなるようなページか?
  21. 記事のメインコンテンツを邪魔するほど、過剰な量の広告がないか?
  22. 記事が雑誌、百科事典、書籍で読めるようなクオリティか?
  23. 記事が短い、内容が薄い、または役立つ具体的な内容がない、といったものではないか?
  24. ページの細部まで十分な配慮と注意が払われているか?
  25. このサイトのページを見たユーザーが不満をいうか?

上記、質問、条件に対応できているのであれば低品質コンテンツではないということになります。まー、そりゃそうでしょうってぐらいたくさん項目がありますよね。ただし、これら項目から必要とされることを推察はできると思います。
インデックスがどうしても進まないときは自分のコンテンツに対して問いかけてみましょう。

ちなみに、 「クロール済み-未登録」 はこのほか内部リンクや外部リンク要素も大きな要因です。

大量のページを旧ページから引継いでいない

リニューアルやASPの変更などで、数百、数千という数のURLを新URLへ変えなくてはいけないことがあると思います。このような時は必ず旧URLから新URLへ301転送をしないと、新URLがインデックスされるまでに3ヶ月以上かかってしまいます。
この原因は、1サイトあたりにクロール負荷量に上限があるにもかかわらず、転送が行われないといつまでも旧URLをクローリングしてしまい、新URLまでクロールされるのに時間がかかてしまうことが主な原因です。
301転送を対になるページに行うのがべストですが、何かしらの理由で行えない場合以下の対応を行うことで早めることが出来ます。

  • 新しいsitemap.xmlを作成し、サーチコンソールから申請する
  • 負荷の大きい必要のない画像URLを削除し削除申請する
  • インデックス申請をサーチコンソールから行う

上記もいろいろと欠点があります。
「新しいsitemap.xmlを作成し、サーチコンソールから申請する」
⇒数ページを早めることはできますが、数百、数千はできません。やらないよりかはマシというところです。

「負荷の大きい必要のない画像URLを削除し削除申請する」
⇒最初に対応したほうが良いです。結局負荷量の問題なので、その負荷量を減らすわけなので効果的です。

「インデックス申請をサーチコンソールから行う」
⇒1URLあたり数回実施しないとほぼされません。ただ確実です。大きな欠点として1URLずつしかできません。

注意しておきたい点として、旧URLを削除申請してしまうということです。旧URLは通常であればステータスコード404になっていると思います。この削除申請をしてしまうと、クローラーがその期間中にクロールしないため404であること自体の認識が進まないのでやってはいけません。

また、別軸での対応策の1つでかんたんにできるもので「ping送信」があります。
⇒pingサーバーにサイトの更新情報を伝えるping送信を行います。これを行うことで、Googleクローラから見つかりやすくすることができます。送信先はいろいろあり、以下の2つはお金もかからず簡単にできるのでお勧めです。

  • https://feedburner.google.com/fb/a/ping
  • http://pingoo.jp/

まとめ

インデックスはSEOの基本です。インデックスさせないと評価がされません。評価がされなければランキングもされません。とにかくインデックスが最も大切なSEO対策になります。