(メモ)GoogleトレンドのRSSのURLが変わってる気がする

テクノロジー

先の記事で調査していたら、一緒に発見した。

https://trends.google.co.jp/trends/trendingsearches/daily/rss?geo=JP

が404 Not Foundになっている。
えー、今朝は動いてたのに!?

というわけで、↓に変更。

https://trends.google.co.jp/trending/rss?geo=JP

Googleトレンドの「急上昇中」で拾えるRSSフィードのURL。
とりあえずこれで様子を見てみることに。

急上昇中 - Google トレンド

なんか、以下の点が違う。

  • 今日のものしか出ない
    • いままでは前日とか前々日とかあった気がするんだけど…
  • ニュースがないことがある
    • ht:news_item 要素が存在しないことがある。
    • ht:picture 要素が空要素になっていることがある。この場合、ht:picture_source も空。
  • ニュースがある場合、1トピックに3件ある
    • 前は2件じゃなかった?
  • ニュースの関連性の精度が明らかに下がっている
    • トレンド入りした理由とは思えないニュース記事、またはニュースではないブログがリンクになっている
    • 前はちゃんと信頼できるニュースサイトの記事が2個あったはずなのに…
  • それどころかトレンド自体も怪しい
    • あまりにも更新頻度が早く、トレンドの数も多いので、「たまたま直近数時間で検索数が多かった1単語」が出てくる。
    • たとえば、「リアルタイム」というトレンド。おそらく茨城で地震があったので、「地震 リアルタイム」あたりで検索した人が多かったから…じゃないかな…
  • Googleトレンドのページに出ているトレンドがそのまま取れない
    • Googleトレンドのページで、並び替えを「新着順」にしたものとRSSが一致する。
    • なので「たまたま直近数十分で検索が多かった1単語」なのは正しい。
    • いやトレンドってそうじゃなくて、並び替え「関連度順」が欲しいんだが…!?
  • そもそも日本語の判定が怪しい
    • 平気で中国語が出てくる。
    • 日本人の漢字と中国人の漢字の見分けがつかないコンピュータあるあるを、令和の時代のGoogle様がやっている。
    • なんなら英語も出てくる。「ICU」が実際にトレンドになった瞬間があったんだろうと思うけれど、引っ張ってきたニュースが全部英字。日本とは?

ちなみにGoogleトレンドのページに出ているトレンドそのものは、エクスポートメニューの「CSVで出力」で取れる。
でもCSVのファイル名はどんどん変わるし、何よりURLが分からないので、これを自動解析するのはあまり良くなさそう…

というわけで、GoogleトレンドのRSSが使い物にならなくなってしまったという記事でした。

コメント

タイトルとURLをコピーしました