↑上記記事のコメント欄にて、
もんきちさんや匿名大喜利@wiki管理人さんとやりとりして、
なんとなく僕が匿名大喜利のランキングを復活させる空気になったので、最初のスタートを切ってみました。
↓目指す完成形…山の頂きは遠い
ちゃんと一歩目は踏み出しましたよ!
ただし踏み出したのはいいのですが…(後で書きます)
Webサイトからデータを収集するのはスクレイピングと言うようです。
アプリ(有料、無料)、エクセル(のやり方も二通り)など色々方法があるけど、
僕はいつも使ってる動作が軽いGoogleスプレッドシートでなんとかしたい…
↓こちらを参考にしました。
著作権やサイトへの負荷など、
スクレイピングがグレーな行為になる場合もあるようですが、
匿名大喜利のルールや利用規約をチェックしたところでは、それが禁止と読み取れる内容は無かったです。
でも、これを公開する段階に来たら管理人さんに連絡しようと思っています。
今はそもそも自分がやれないかもしれない(の可能性の方が大きい)のでまだ聞いていません。
それに多分ですが、
管理人のぶほほさんからはお返事や反応は無いと予想してます。
今までもないもん( ;∀;)
要所要所では連絡してるんだけど一回も返事が…
最初だけ苦戦したけど、ここまではできました↓
お題、回答、ボケ主、ワロタ を僕だけ一覧で見られる様にしました。
自動でデータを拾ってきてくれます。
余談ですが、
うっすら茶色い点に見えているのは、もんきちさんの🙊マークです。
ボケの投稿日時らしきデータも見つけたのですが、載せ方が分からず日時欄はまだ無いです。
試しでやっているので、ひとまず30回答分ぐらいだけです。
ちょっと嬉しかったです。ちょっとだけ出来た!!
これが上手く行けば、後はワロタ多い順で並び替えたり、
ユーザーページのデータも取得して、先月との数の違いを表計算すれば、月間打率なども出せます。
しかし、今、大量に載せようとすると「読み込んでいます」表示で長時間固まるので、
大量のデータをさばくのはスプレッドシートでは無理ぽいです。
追記:と言いつつ数時間経つと全部データが入力されていました。やれるのか?
この時点で、
アカギさん(以前データを整理されてた方)がやっていた処理のたぶん1%しかやってないです。
なので現時点では、僕がアカギさんレベルのデータ整理を実現するのは絶望的です。
(^-^;
アカギさんはどうやってたのかなあ?
パソコンのスペックが良かったのか、ツールを工夫していたのか…
ただ、
毎月の優秀ボケベスト10ぐらいならやれなくはないです。
でもそんなのはパソコン使わなくても人力でもやれそうですが。
どこまでできるだろう?
まだ不透明ですが土日に進めてみます。
あんまり期待しないで待っててください(どっちだよ!)