■外部リンク:ITmedia「その個人情報はうそか本当か、AIが判定 4種類のうそのつき方が明らかに」(2021/10/15)

 

オンライン上で私たちの個人情報を入力する場面って、たくさんありますよね。

で、集められた大量の個人情報。

多くのケースではちゃんと適正に使われているのでしょうけど、それでも情報の流出であるとか、不正使用であるとか、がニュースになってきたことも何度も何度もあったわけで。

となると消費者の立場といたしましては、バカ正直に個人情報を入力するのは危ないぞ、と警戒したくなるのも当然の話。

しかし、ウソの個人情報が多くなってしまうと、企業サイドとしてはデータ分析に使えない情報がどんどん積み上がっていってしまうわけで、それもまた困った話ではあります。

 

 

 

そこで、英国の研究チームが開発した、今回のシステム。

機械学習を駆使することで、入力された個人情報が正しいものか、そうでないか、を89.7%という高い精度で判定することが出来るのだとか。

……ただ、ユーザーがウソ情報を入力したかどうか見破るシステムを作る前に、まず個人情報の流出や不正使用を徹底的に防止する仕組みを作るのが先なんじゃないの、とは思いますけど笑

 

ともあれ、実に素晴らしいシステムではありますが、今回はあえて、ユーザーが入力するウソの個人情報のパターンに注目してみたいと思います。

それによって、今後私たちが消費者サイドとしてウソ情報を入力したい時の参考になればいいな、と。

ウソをつくのも、意外と大変ですからね。

 

 

 

さて、元記事さんの見出しにもありますが、今回の論文の中では4つのパターンに分けられています。

 

無効な情報 (Invalid information)

これは、所定の形式やパターンをまったく無視した、無意味な回答。

まあ、まったくのデタラメな情報、というわけで、これ以上補足することはない感じ。

 

有効な情報ではあるが、完全にウソ (Valid and Untrue)

所定のパターンやフォーマットには一応従っているものの、書かれている内容は全くのウソ、というもの。

実際にあったウソ回答としては、

  • 連番 (1234など)
  • ゾロ目 (5555など)
  • キーボードの配置そのままの文字列 (qwertyなど)
  • 架空の固有名詞
  • ランダムな文字列

などがあったとのこと。

 

有効な情報ではあるが、部分的にウソ (Valid and Partially Untrue)

これは、②よりも本当の情報に近い回答。

完全なウソをつくよりも、一部だけウソをつく方が消費カロリーは低そうなので、そうした意味ではお手軽な方法と言えるかも?

  • 名前欄や住所欄などに情報の一部だけを入力する (フルネーム欄に苗字だけ、住所欄に市町村名まで、など)
  • 正しい情報の中にウソが混じっている (郵便番号の上3桁は正しいが下4桁はデタラメ、生年月日欄の"年"だけ正しいが"月日"は1/1などデタラメ、など)

 

回答拒否 (Refusing to answer)

まあ、これも名前のとおりなのですが、

  • 住所欄など、ある程度自由に入力できる欄に「いいえ」「無回答」「該当なし」のように入力する
  • メールアドレス欄に「notproviding@email.com」 (provide=提示する)、「prefernottosay@survey.com」 (prefer not to say=できれば答えたくない) のように入力する

みたいに、さりげなく意思表示をしてみたりするモノ。

ただ、イギリスでの調査がベースになっていますので、日本語の場合はちょっとだけ難易度が上がるかも?

メールアドレスの方は使えそうではありますが笑

 

機会があれば、いつか是非使ってみたいな、と個人的には思っていたり。

ご興味をお持ちの方は、元記事さんや論文などもどうぞご覧あれ。