あれからもちょこちょこやっていました。


・抽出条件を減らしてレコード数を増やしたものの、大して変わり映えしませんでした。


・形態素解析の辞書にない単語は、「前処理→語の取捨選択→強制抽出する語の指定」に

書き込めば単語として切り出されるみたいです。




まぁそんなこんなであまり進んでいません。




ところで、この間


「テキストが後半からほとんど理解できなくなってきた(-"-;A」


と書きましたが、こちらを解消すべく

amazonでマクロ経済学の教科書を注文する時に偶然見かけた本を買うことにしました。



惹かれたのはこの一文・・・


「難解な数学知識が必要で文系の学生・研究者にとっては

厄介者だった統計を、丁寧な解説とCD-ROMに収録した

分析ソフトで有益なツールに変える一冊」


まさに私のために書かれた本ではないでしょうか(笑)

言語研究のための統計入門/くろしお出版
¥2,940
Amazon.co.jp

コーパスや小説の分析例が多く載っているので、イメージしやすいかも?(まだ読んでいませんが)


そこそこボリュームはあるので、早く読まないと後期が終わっちゃいそうです。