RMeCabで過去問分析(+_+)

ヤッパくんです。

今回は思い立って、RMeCabを使った過去問分析をしてみました。

オイオイ、直前期にそんなことしてていいんかよって思ったアナタ、大丈夫、そんなに手間かけてやったわけじゃありません。それだけにちょっと精度のほうはちょっとビミョーですが、だいたいのところがわかればよいかと・・汗

ちなみにRMeCabって、知っているヒトは知っている、

統計ツールのRと、形態素解析を行ってくれるMeCabをつないでくれるインターフェースツールです。

つぶやきのような、大量な定性情報から傾向を読み取ろうとするのに有効な、でもって使ってみると結構楽しい♪ツールです。フリーですのでよかったらググって使ってみてください。

操作は基本コマンドベース（用語的にはＣＵＩ）なので、そのあたりがメンドーな方にはおすすめしません笑

今回は、過去５年分の過去問に対して、連体詞と副詞の用い方の違いに作文者の個性が出るという仮説からグループ分けをしてみるという試みをしてみました。

内容は以前放送大学で講義していた内容を参考に、統計手段はk-means法というのを使ってマス。

結果がコレ↓

・・・予想に反して、結構固まっちゃいました。もっとプロット領域全体に散らばってくれることを期待したんですけどね。あまり飛びぬけて個性のある過去問はないようです。

以下、気づいた点、

・事例１と２が、赤、黒と綺麗にグループ分けされています。その点で、やはり事例間の違いは、統計的にみても存在してました笑。

・H22-2が頭一つ分はみ出てます。この事例は、出題されたときも「分析問題しかない」とかいろいろ騒がれた事例でしたから、ほかと比べてちょっと外れているのは納得の結果です。

・事例２に着目すると

H20,H21,H22と縦軸が上昇して、H23,H24は反対に段階的に下降し底辺まで到達しました。

とするとH25を飛びぬけない事例にするためには元に戻す作用が働いて、真ん中あたりに位置するH21のような問題文になったりしそう、とか、予想屋のごとく思いを張り巡らせてしまったり（笑

ただ、やはり全体的には固まってしまってますので、あまり過度な期待は禁物です。

で、これじゃツマラナイので、過去の某予備校の模試もろもろを投入してみると・・・

そこそこ外れて出てきました（汗

なにげなくやっぱり違いが出ているものなんですね。

２次試験攻略にはやっぱり過去問攻略が大事なんだなぁと、いう成果が見れただけでもヨシとしとくか汗

うんうん。

テツになる勇気。