先の記事で調査していたら、一緒に発見した。
https://trends.google.co.jp/trends/trendingsearches/daily/rss?geo=JP
が404 Not Foundになっている。
えー、今朝は動いてたのに!?
というわけで、↓に変更。
https://trends.google.co.jp/trending/rss?geo=JP
Googleトレンドの「急上昇中」で拾えるRSSフィードのURL。
とりあえずこれで様子を見てみることに。
急上昇中 - Google トレンド
なんか、以下の点が違う。
- 今日のものしか出ない
- いままでは前日とか前々日とかあった気がするんだけど…
- ニュースがないことがある
ht:news_item
要素が存在しないことがある。ht:picture
要素が空要素になっていることがある。この場合、ht:picture_source
も空。
- ニュースがある場合、1トピックに3件ある
- 前は2件じゃなかった?
- ニュースの関連性の精度が明らかに下がっている
- トレンド入りした理由とは思えないニュース記事、またはニュースではないブログがリンクになっている
- 前はちゃんと信頼できるニュースサイトの記事が2個あったはずなのに…
- それどころかトレンド自体も怪しい
- あまりにも更新頻度が早く、トレンドの数も多いので、「たまたま直近数時間で検索数が多かった1単語」が出てくる。
- たとえば、「リアルタイム」というトレンド。おそらく茨城で地震があったので、「地震 リアルタイム」あたりで検索した人が多かったから…じゃないかな…
- Googleトレンドのページに出ているトレンドがそのまま取れない
- Googleトレンドのページで、並び替えを「新着順」にしたものとRSSが一致する。
- なので「たまたま直近数十分で検索が多かった1単語」なのは正しい。
- いやトレンドってそうじゃなくて、並び替え「関連度順」が欲しいんだが…!?
- そもそも日本語の判定が怪しい
- 平気で中国語が出てくる。
- 日本人の漢字と中国人の漢字の見分けがつかないコンピュータあるあるを、令和の時代のGoogle様がやっている。
- なんなら英語も出てくる。「ICU」が実際にトレンドになった瞬間があったんだろうと思うけれど、引っ張ってきたニュースが全部英字。日本とは?
ちなみにGoogleトレンドのページに出ているトレンドそのものは、エクスポートメニューの「CSVで出力」で取れる。
でもCSVのファイル名はどんどん変わるし、何よりURLが分からないので、これを自動解析するのはあまり良くなさそう…
というわけで、GoogleトレンドのRSSが使い物にならなくなってしまったという記事でした。
コメント