だいぶGoogleインデックスの登録状況が改善されてきた件

先日、この日記でグーグル様のインデックス記事がうまいこと登録されていない件を書きました。

https://…/2020/05/06/ 最近Googleでこのブログの記事が検索ヒットしないと思った件

"はてなブログ"特有の事象で、グーグルが"はてなブログ"のサイトマップをクロールした際に、うまく受信できていないのか理由は不明ですが、グーグル様では『取得できませんでした』とエラーになってしまうのです。

f:id:TARSAMA:20200524211326g:plain
・【使いまわし写真】サイトマップ読み込み状況はほとんどがエラー・・・・

サイトマップの受信ができないということは、このブログの記事一つ一つを認識できない事になるので、インデックスされないのでしょう。


そこで取った手は2つ。

  • 自分で主要な日記のURLを、グーグルサーチコンソールから手で登録する(概ね2010年以降のもの)
  • ブログの更新をしたあと、グーグル様に自分でpingを送信する(ネットワーク診断ツールのpingではない。)

前者は、そもそもサイトマップのクロールを期待できないので、自分で登録するという気の遠くなる作戦。しかも一日50URLという制限があるので、気長に実施。コロナで暇なのが助かったわ~。

https://…/2020/05/18/ Googleサーチコンソールで日記URLを一つ一つ手動送信している件

当初は5,000記事を目標にしていましたが、どうやら登録を進めていくとGoogleにURLは認識されていてもインデックスされていない記事もあり、ワタシ的に駄文と感じる日の記事は、Google様でもインデックスされていない感じ・・・・おそらく駄文判定ロジックがあり、検索されても意味がないものは除外するようになっているのね。

f:id:TARSAMA:20200609142307g:plain
・有効なインデックスに登録された記事数時系列グラフ

なので5,000記事は諦めて、4,850ほどで妥協しましょう。


そして後者。サイトマップが変わったのでクロールしてねという合図。"はてなダイアリー"時代は自動で送信されていたのですが、"はてなブログ"に変わってからは非サポート。別の方法になったみたいですが、結果的にはうまく働いているとは言い難い。


仕方がないので自分で手動送信するようにしたところ、概ね半日以内にはクロールしてくれるようになりました。

f:id:TARSAMA:20200609141715g:plain
・そして毎日少しずつ、クロールされていくように

そしてクロールしてくる度に・・・・月ごとのサイトマップが全滅ではなく、2つ3つだけは成功するので毎日繰り返せばやがて全日程をクロールしてくれる気がしてきました。(現在、約45%のサイトマップを受信されている模様。)
とにかく無駄に記事数が多いので大変!

https://…/2018/12/04/ "はてなブログ"記事修正サポートアプリの作成

さっそく自作のブログサポートアプリにping送信を組み込んでおきました!