ビッグデータって面白い! -2ページ目

ビッグデータって面白い!

ネット上の何億というクチコミを分析すると見えてくる世界があります。

まずは、Lチキのクチコミのポジティブ
発言(好意的発言)とネガティブ発言
(否定的発言)の件数をグラフ化しています。

オレンジ色がポジティブ発言の数です。
青色がネガティブ発言の数です。
1
年間でのクチコミ件数の推移が分かります。



L-チキ ポジネガ


Lチキキングというのは、期間限定で発売された

Lチキという唐揚げのサイズの大きいものです。

 

Lチキに関するクチコミ発言は、おおむね

ポジティブです。


ブログ記事に掲載するデータ量の制限で
小さな画像しか掲載できません。

こちらをクリックすると大きい画像で見ることができます。


次に発言している人の性別を比較してみました。


L-チキ 男女比
大きな画像は、こちら。

次回は、

からあげクンについての情報を

見てみましょう。

一年くらい前に、ちょっと面白いかなと思って、
コンビニのから揚げに関するクチコミ情報を
解析してみました。

情報ソースは、日本中のブログです。

コンビニで販売されている代表的な4種類

(からあげ棒、とりから、からあげクン、Lチキ)を
比較してみました。

通年ブログ内クチコミ件数:

7-11からあげ棒 405

鶏から 710

Lチキ 3,797

からあげクン 8,121

 

グラフで表すと以下のような感じです。

赤い線がからあげクン

青い線がLチキ

黄色い線が鶏から

緑の線がからあげ棒


一年間での発言数の推移が分かります。


次回は、発言件数の多い商品を詳細にクチコミ解析
してみます。

 

世の中では、良くビッグデータという言葉を耳にすると思います。

今までは扱えなかったくらい大容量の情報を処理して、
様々な利用価値のある抽出してくる取り組みのことを
指している場合が多いようです。

通常では、数字のデータをたくさん集めてきて、それを
コンピュータで処理して、価値ある情報を抽出すること
が殆どだと思います。

このブログでは、世の中のクチコミ情報を色々な角度
から眺めてみる、ということを記載していきたいと
思います。

つまり、文章情報をたくさん集めてきて、その中から
面白そうな情報を抽出してみようと考えています。

具体的には、どんなことをしているかというと、
日本中のブログ情報を毎日120万頁分
集めてきて、それを1年分溜めています。

随分とたくさんの情報をデータベースに格納
しています。その情報を様々な視点から眺めて
見ようということが、このブログの趣旨です。

次回から、実際にクチコミ情報を色々な角度
から眺めて行きたいと思います。