CiNiiで国内の学術論文を探していると、興味深い論文を見つけた。
最高位戦 河野直也選手の川柳に関する傾向分析
河野直也選手の川柳と言えば、
自身のツイッターへの返信数、RT数、いいね数が全て100を超えたことを記念に、
先月4月から開始した「1日1句、川柳を詠む」という、
2017年とは思えない、時代に逆行した企画である。
どうやらその川柳の傾向を分析した論文のようだ。
今日は、この論文の一部を紹介したいと思う。
第1章.川柳内容に基づくクラスタリング
研究対象は、河野直也プロが4月20日から5月20日までの1か月の間に投稿した31句。
これらの川柳を「生活関連度」「麻雀関連度」「ポジティブ度」「ネガティブ度」という4軸で評価する。
サンプル数としてはやや少ないが、傾向分析するには十分だろう。
全川柳31句は以下となる。
評価例を、以下に挙げる。
「へっくしゅん いつまで続く 花粉症」
生活度:5 ネガティブ度:3
基本的には生活寄りの内容と捉えるが、麻雀中にくしゃみが出ることも考えて、生活度は5とした。
花粉症の辛さを詠んだものだが、「へっくしゅん」という成人男性がつぶやく語句としては信じられない、愛らしさもあるため、ネガティブ度は3とする。
「来年は 解説者じゃなく 対局者!」
麻雀度:8 ポジティブ度:9
Aリーグ放送解説を行った後の川柳ということで、麻雀に関する川柳と予想されるため、麻雀度は8とする。
「対局者…」であればポジティブ度は低いが、「対局者!」なのでポジティブが強いと考え、9とする。
このように主観評価ではあるが、31句に対して評価を行い、データサンプリングを行った。
生活に関する川柳が多く、ネガティブな川柳がやや多いことも分かる。
また、ネガティブな川柳は、連続して詠まれる傾向にあり、ゴールデンウィーク周辺はその傾向がひどく、ネガティブな川柳しか詠まれていないことも判明した。
家族サービスで忙しかったのだろうか。
川柳の内容に、悩みと疲れが見てとれる。
さらに整理すると、ほぼ「麻雀」「川柳」「気候・体調」「家族」についてしか詠まれていないことも分かる。
◎麻雀(9句)
◎川柳(10句)
◎気候・体調(7句)
◎家族(3句)
今後新しいジャンルの川柳が詠まれることを期待しているが、現状その様子は見られない。
それもまたこの川柳の良さなのかもしれない。
第2章.いいね数、RT数の傾向
川柳内容によって、どれほど「いいね数」「RT数」が変わるかを比較する。
ポジティブ川柳
サンプル数:12
平均いいね数:19.8
平均RT数:3.9
ネガティブ川柳
サンプル数:18
平均いいね数:23.9
平均RT数:4.2
散布図
微差ではあるが、嘆きや悩みに関するネガティブ川柳の方が、いいねされやすく、RTもされている。
フォロワーは嘆きの一句を欲しているのである。
第3章.仮想アカウントによるシミュレーション実験
河野直也プロの川柳傾向を参考に、仮想の河野直也Twitterアカウントを作成し、あたかも本人が詠んだような川柳を投稿するプログラムを構築する。
毎日定期的にツイートをさせ、何人のフォロワーが騙されるかを検証する。
ツイートに用いる用語としては、「麻雀」「川柳」「気候・体調」「家族」に関する用語をあらかじめ投稿用データベースに登録する。
河野直也プロ本人の川柳にできるだけ近づけるため、難しい単語や季語、趣のある言葉は出来るだけ避け、小学生でも理解できるような分かりやすい言葉を採用する。
また、日々の話題に触れられるように、河野直也プロのフォロワーのツイートから言葉を自動学習し、データベースを日々更新する。
「…」や「ありがとう」といった、よく使われる用語については、川柳に使う語句として採用されやすいように、使用頻度パラメータに重み付けしておく。
時刻が0時10分~0時50分(ランダムに投稿時刻を変更)になると、用語データベースから「5・7・5(1音の誤差まで許す)」のリズムで自然な文章となるような言葉を選び出し、川柳を作成し、仮想アカウントでツイートを行う。
以下が、実験結果である。
・・・・・・・・
と、ここまでが無料で読めたところ。
この先には、「4.実験結果」と「5.曽木プロの採点分析」という章があるのだが、有料版だったので読めなかった。
この論文を読んで分かることは、
愛らしい川柳を詠む河野直也プロは、
まちがいなく皆さんに愛されている。
うらやましいです。
ということで
これからも
たのしみにしてます
ありがとう
※河野直也さん本人から許可いただいたときのLINE
なおや了解ですw かわいい。