マニフェストスイッチとテキストマイニング | 前和光市長 松本たけひろ オフィシャルウェブサイト

マニフェストスイッチとテキストマイニング

マニフェストスイッチという「早稲田大学マニフェスト研究所」発の運動がある。選挙の候補者の政策を同一フォーマットで比較することができるほか、それぞれの候補者の政策分野注力度と優先政策をビジュアル化している。
このビジュアル化のフォーマットはよくできていて、政治姿勢が一目でわかると評判である。
ただし、分野の分け方が、社会保障、産業政策、社会資本整備、教育子育てなど、当然のことながら抽象的なので、これを見て直ちに政治姿勢を判断して投票するというのは難しいと思う。
実はこのマニフェストスイッチ、同一フォーマットで政策を同じ位の量のテキストデータで、それぞれの陣営が登録しているのが非常にありがたい。
皆さんはテキストマイニングのワードクラウドと言うものを見たことがあるのではないだろうか。ワードクラウドは、テキストデータ全体から使用頻度が高い用語は、真ん中より大きい字で、そうでもない用語は、小さな字で周辺に示されると言う、非常に分かりやすいテキストデータ分析のビジュアル化手法である。
ところが、選挙の投票のためにテキストマイニングをやろうとすると、結構めんどくさいことになる。
選挙広報は、画像で入稿されるので、テキストデータの抽出が難しいだけでなく、そもそも手書きの広報などもあり、テキストデータとして取り扱うのは非常に問題が多い。もちろん、全部読み上げて入力するなどの方法もあるが、正直一有権者ではそんなことはやってられないわけである。
また、それぞれの候補のホームページからテキストデータを抽出すると言う方法もあるが、これも公平に比較するには心もとない。
そして、実は、マニフェストスイッチの同じようなボリュームで入力されたデータを比較すると言うのが1番公平かつ効率的でわかりやすい選挙へのテキストマイニングの適用じゃないなんじゃないかと私は思う。
テキストマイニングを本格的にやろうと思うと、それなりに勉強する必要があるが、実は簡単な方法がある。それはAIテキストマイニングのユーザローカル社のホームページを使うという方法である。ここに、テキストデータを流し込むだけで、最低限のテキストマイニング上の加工ができるわけである。
この方法で、試しに同社のサイトのシステムを使って徳島県知事選にかかるマニフェストスイッチの「詳しい政策はこちら」に書き込まれたデータを比較してみたのが下記の画像である(実際には名詞だけに絞る、)。
ご覧の通り、それぞれの候補者の個性が一目瞭然になる。もっとも、マニフェストスイッチ自体はそんなにどこの選挙でもやっているわけではないので、これが使えるのはごく1部の選挙にすぎない。ただしぱっと画像を見ただけで、その便利さと、破壊力がよくご理解いただけるのではないかと思う。

 

三木とおるさん

古田 元則さん

後藤田正純さん

飯泉嘉門さん