参考:Wikipedia記事「ビッグデータ」
私流にもう少し噛み砕いて言えば、ビッグデータとはとにかく巨大なデータのことです。もしそれを使いこなせれば人類が未体験な巨益を生み出すことも可能です。ただし、巨大すぎる故に通常のPCでは処理できないんですね。なんだか、以前書いた「カオス理論の限界」という話にも通じてきます。
参考:過去記事「科学主義とは何か」
また、この言葉には最近もうひとつの解釈があって、「大規模なマーケティングデータ」という意味で用いられることも多いようです。こっちは処理可能なデータを指している訳ですが、それでも巨大であることに変わりありません。今回はこの話です。
【ビッグ「マーケティング」データ】
Suicaで買い物をしていると、「35歳、男性、○○駅勤務、○○駅の○○バス停付近に居住」という私が、「セブンイレブンに行く度にタバコと冷たいブラックコーヒーを買い、日清チリトマトヌードルBIGが大好きで、ちょっとでも暑い日はすぐガリガリ君を食べる」ってことくらい、全てわかっちゃいますからね。で、要するに私が「デブ」ってこともバレちゃう訳です。
参考:過去記事「あなたの情報は盗まれてます(1)」
従来、こういう仕組みはネット通販の世界だったのですが、過去記事で詳しく書いたように、電子マネーやポイントカードの普及によって、現実世界での買い物でもそれが実現されつつあります。しかも、多くの市民が知らず知らずのうちにですから、少々厄介です。
参考:過去記事「知られざるポイントカード」
こうして自動的に蓄積されていく個人情報を集めると、ビッグ「マーケティング」データができあがります。これを解析すれば効率的なビジネスを実現しますから、大企業にとってのメリットは計り知れません。私達消費者もより便利に、効率的な買い物ができるようになる筈です。
でも実際には、市民の多くはこれに賛同的ではなさそうです。
【個人情報の流出では?】
JR東日本は今年6月、Suicaから集めたビッグデータを日立に販売するとプレスリリースしました。そのとたん、炎上しました。要するに、「私の個人情報を勝手に売るな」という批難が生じて、すぐさまお詫びする羽目になったようです。確かに、自分の行動履歴を勝手に売り渡されるなんて、気分の良い話ではありません。
参考:ITmediaニュース(2013年07月25日)「JR東日本、Suicaデータの社外提供について詳細を公表 希望者は提供データから除外も」
しかしこの批判には、一部誤解も含まれていますので整理して考えてみましょう。
まず、JR東日本が販売しようとしてるデータは、個人を特定できる氏名を含んでいません。つまり法的には個人情報ではありません。しかし一方、氏名が無くても上記の私のような特徴的な行動パターンが解析できれば、私の知人が私個人を特定することは可能です。
つまり法的には問題無くても、悪用の可能性は否定されません。個人投資家の山本一郎という方は、NTTドコモがこうした問題点に対策しているのに、JR東日本のデータ処理では不十分と指摘していますね。なるほどです。
参考:Yahoo!ニュース(2013年9月9日)「ドコモのビッグデータビジネスはJR東日本のそれと何が違うのか」
つまり個人情報の取り扱いには、言わば合法的グレーゾーンが存在するために、個人情報流出ではないが個人の特定は可能という、相矛盾した状態が生じてしまいます。だからと言って規制を強化すれば良いものでもありませんので、そこが難しいようです。
【データ所有権の帰属は?】
他方、この問題について弁護士の郷原信郎という方は、BLOGOSで次のように述べています。少し長いですが引用します。
(以下、BLOGOS(2013年09月13日)「ビッグデータは誰のものか」より引用)
「スイカ・データ、ドコモ・データがまさにそうであるように、これらのビッグデータは、多額の対価を得ることができる大きな経済的価値を有するものであるが、当該企業自らがコストをかけて創造したものではないし、データに対する対価を払って取得したものでもない。鉄道事業や通信事業における大量の消費者との取引の中で「事実上取得した情報」に過ぎない。
(中略)
このような場合、その情報が誰に帰属するのか、それを活用して利益を得ることが許されるのか、ということに関して、現行法では何も定められていない
(中略)
ビックデータを最先端の情報処理技術によって活用することは、消費者にも大きな利便をもたらし、経済社会にも大きな価値をもたらす行為である。その有効活用は、まさに、社会の要請に応えるものと言えよう。そのために、有効活用していくことについて利用者側・消費者側にも納得が得られるよう社会的コンセンサスを形成することが必要なのである。
(中略)
ここで生じた反発は、「個人が特定され個人情報が使用される恐れ」に対する不安によるものだけではない。根本的なのは、「電車の乗降という自分自身の行動に関する情報を鉄道会社側が勝手に使って利益を得ることに対する反発・違和感」である。
(引用ここまで)
つまり、結果的に収集されたに過ぎない「ビッグデータ」がその企業固有の知的所有物というのは、現実的な価値観に照らせばおかしいということです。しかもそれを商売にして利益を得るという行為が、彼の指摘するように社会的コンセンサスを得られているとも思えません。「勝手に売るな」という声が出るのも当然です。
【ビッグデータは公共財である】
ところで、私はこの問題を見ていて、ヒトゲノム問題と同じだなと感じています。
ヒトゲノム(=現在解析が進められている人間の遺伝情報)とは、本来、人類の誰もが細胞内に元々所有している情報なのだから、それを解析した人が知的所有権を主張できるかという倫理的問題が生じます。本来これは、人類の健康や治療に役立てられるべきものであって、それは安価で平等に提供されるべきものです。であるならば、誰かの権益を潤す必要などありませんよね。
私は、ビッグデータも本来は、人類が平等に共有し、社会発展のために広く活用されるべきものと考えます。公共財、つまり公の利益に活用されるべきものであって、運良くそれを所有した企業だけが私益に活用できるというのは、いかんせん腑に落ちません。頭の中で、「この大陸は私が最初に見つけたんだから私の物」というコロンブス的主張と、どうしてもダブります。
でもねコロンブスさん、そこは他人の土地なのよ。
ビッグデータもコロンブスさんのものじゃありませんよ。
ジャイアンじゃないんですからね。
今回も最後まで読んで下さりありがとうございました。
あと最後に、報告が遅れましたが「人気記事ランキング」を削除しました。順位が予想以上に変動しないため、ページが重くなる以上のメリットが感じられませんでした。「親日家世界一」のアクセスだけが増えるのも、喜ばしい反面ちょっと複雑な気持ちでしたので。
また別の良いツールが見つかれば再開するかも知れませんが、当面はこの状態で行こうと思います。
面白かったらランキング上げて下さい→