データマイニングをやってみようと思った理由は、

膨大な実践データの収集が可能であると知ったからです。

 

その方法とはウェブスクレイピングです。

ウェブスクレイピングとは、ウェブサイトから情報を抽出するプログラミング技術を指します。

 

パチンコ屋さんのホームページで、

会員登録しなくてもハナハナの実践データを閲覧することが可能なので

こちらを使用させて頂きます。

 

そこで実践データの著作権について調査しました。

 

数値(実践)データは、事実を表すものであり、

思想感情を創作的に表現したものではないため、一般的には著作物に該当しない。

仮に著作物に該当した場合でも、情報解析のための複製等(参照:著作権法第47条の7)が

認められているので問題ない…はず(個人の見解)。

 

よって、不安が残るので実践データそのものの公開は控えさせて頂きます。

 

次回、ハナハナ実践データの収集、統計処理結果