いあめり近年のスマートフォンに必ずといっていいほど搭載されているのが、物体の角度や角速度を検出するためのジャイロスコープ。位置情報の精度を高める役割も果たしているので、iOS・Androidのアプリがジャイロスコープを利用するときは、特別な許可を取らなくても使うことができます。しかし、最新のジャイロスコープはスマートフォン周辺の音響信号を測定することが十分に可能なほど高性能になっており、スタンフォード大学の研究チームが「ジャイロスコープから得られる超長波情報をもとに、スマートフォンの周りで行われた会話の内容を認識可能なレベルにまで解析する」という、なにやらとんでもないことを成功させました。

Mobile Sensors Exploitation
http://crypto.stanford.edu/gyrophone/

Gyrophone: Recognizing Speech From Gyroscope Signals
(PDFファイル)http://crypto.stanford.edu/gyrophone/files/gyromic.pdf

実験の概要は以下のムービーを見ればよく分かります。

Gyrophone: Recognizing Speech from Gyroscope Signals - YouTube


ジャイロスコープは現代のスマートフォンには「ほとんど」といっていいほど搭載されています。

このジャイロスコープという機器は、角度と角速度を計測するための機器です。

iOSやAndroidでは、このジャイロスコープを使用する際にスマートフォンのユーザーから認証を得る必要がありません。

そこで研究チームは、ユーザーの許可なく使用可能なジャイロスコープを使ってスマートフォンの周囲の会話を盗聴できないか、という研究をスタートさせたそうです。

アプリやウェブサービスがスマートフォンのマイクを使用する際は、ユーザーから許可を得る必要があります。そこでマイクは全く使用せず、ジャイロスコープから得られる情報、つまり現在アプリやウェブサービスが自由に取得可能となっているデータのみを利用した模様。

この研究の結果、個人を特定できるレベルの情報はもちろん…社会保障番号 や……クレジットカード番号まで得ることができたそうです。

なお、この研究はスタンフォード大学の研究チームがイスラエルの防衛企業Rafael と共同で進めた研究であり、この研究の中で発明したAndroidアプリ「Gyrophone (ここから直接ダウンロード可能)」を使うことで、スマートフォンのジャイロスコープにあるプレッシャープレートから音の振動を収集できるようになります。なぜジャイロセンサーで音を録音できるのかというと、Androidではジャイロセンサーに200Hzもしくは1秒間に200回までの動きを検知できるように設定しているからであり、この「200Hz」という数値は人間の声の周波数帯域である80Hz~250Hzをほとんどカバーできるからです。

研究チームは、アプリで録音した音から「スマートフォンの周辺でどんなことを話しているのか」を再現することに成功しました。ジャイロスコープ経由で録音できる音は、人間の耳にとってはほんのわずかな風切り音のようなものですが、スタンフォード大学のYan Michalevsky氏とRafaelのGabi Nakibly氏によって作成された、機械学習を用いて学習する音声認識プログラムにより正確に音を解析し、実際にどのような音が鳴っていたのかを判断できるようにまでなった、というわけです。

現在のところ「Gyrophone」では会話の中の一部分しか録音できず、一度にデータを得られるのは数字や「Oh」などの一語程度とのこと。しかし、スマートフォンと被験者を同じ部屋の中に置き、被験者に部屋の中で適当に声を出してもらったところ、被験者の話す言葉の一語一語を65%の確率で正確に識別できるレベルであり、話し手の性別に関しては84%の確率で当てることができた、とのこと。

研究チームのDan Boneh氏は「我々は音声認識のエキスパートではなく、セキュリティ分野のエキスパートです」とコメントしており、より適切な音声認識技術を使用したり、専門家が音声認識の部分に携わったりすれば、より精度の高い解析も可能になるとしています。また、Android端末とiOS端末は両方ともにジャイロスコープを搭載していますが、iOSではジャイロスコープの機能を100Hzまでの読み取りに制限しているそうで、盗聴はAndroid端末よりも難しくなる、とのことです。

アメリカのCIA等が出てくるドラマに携帯電話の盗聴が出てきますが、この方法ですかね? ドラマでは、簡単に相手に気付かれずに盗聴しているけど