燃えたあと、すぐに該当コンテンツが削除されたので、私も「あっ、すぐ問題を理解したので降ろしたのだな」と思っていたところ、北陸大学の山本啓一先生が世界的にも犯罪抑止のために人工知能が利活用されているよという指摘をされていたので補足をしたいと思います。



 私も本件では犯罪抑止目的の人工知能利活用については完全な利害関係者のため、なるだけ中立的に解説を書きたいと思いますが、データ利活用推進派としての意見であることはご留意ください。

 まず、山本啓一先生ご指摘の内容はもっともで、2011年以降、犯罪抑止のための人工知能の利活用はEM(ExpectationMaximization)法を用いた犯罪予測アルゴリズムを基にした犯罪予測を全米80以上の市警察が導入しており、また、シカゴ市ではハンチラボと呼ばれるアルゴリズムを犯罪抑止AIとして利用することで特定地域の凶悪犯罪発生率を抑えることに成功しました。

 同様に、我が国でも京都府警が2016年に予防型犯罪防止システムの運用を開始しました。これは、俺たちの山田敏弘さんが盛大に馬鹿にする記事をIT Mediaなどで掲載し、関係者一同顔真っ赤になっておりましたが、その後も順調に運用が進められ、費用対効果は良く分からないけどとりあえずなんとなく犯罪が減った感じがするからよいだろうということでこんにちに至っております。実際、2019年から21年にかけては昨対で劇的に犯罪が減ったわけですが、これは人工知能による犯罪抑止システムが奏功したからなのか、コロナウイルスが流行して中国人の入国が減ったからなのかはまったくわかりません。何で減少したんでしょうね。

京都府警の「犯罪予測システム」が使えない、これだけの理由:世界を読み解くニュース・サロン(1/5 ページ) - ITmedia ビジネスオンライン https://www.itmedia.co.jp/business/articles/1610/06/news018.html

 さて、立正大学のデータサイエンス赤ずきんシリーズとこれら実際に稼働している日米の犯罪抑止システムとの間にどのような違いがあるねんという話になるわけです。

 立正大学のデータサイエンスにおいては日本の昔話に出てくる赤ずきんらが何の捜査権限・情報入手資格があるか不詳ながら、データサイエンティストとして出どころ不明のデータを分析し、問題を解決することになっています。ここで、村人のきびだんごなどの購買データや顔つきや挙動、位置情報を何らかの方法で蒐集してきて適法な匿名処理することなく分析をおこなって犯罪の発生を予測するシナリオです。

 問題は、第一に、これらの分析は「個人に紐づくデータ」でその個人を可逆な状態においたままデータ分析を行い犯罪予測をしているように見えること。第二に、購買データや位置情報をいくら分析しても犯罪予測はできないことを知らずに、あたかもデータサイエンスを駆使すれば犯罪発生を予測できると誤認させるコンテンツになっていることです。

 単純な話、特定の時間に変な歩き方をしていたり、きびだんごなどを買ったりする行動パターンを持つ個人は、蒐集したデータを照合し個人を特定することは容易であり、これはアメリカでも日本でも犯罪予測のデータ処理では禁忌になっています。実際、そのような表現になっていました。

 また、天候データ、購買履歴や位置情報を集めただけで犯罪が起きるか予知できるなら世の中こんな簡単なことはありません。極論、みんながTポイントを使えば犯罪予測できてしまいます。そんなわけがあるか。実際には、どのような傾向の特徴が具体的な犯罪発生を誘発したかという、起きた犯罪のデータのほうがはるかに大事で、購買履歴は実際にゴミだし、そもそも店があって人流があれば確率で購買そのものは発生するため、それは単なる交絡因子であって、ゴミをいくら分析してもゴミであることはTポイントがすでに証明しています。

 そういう犯罪を起こした人の行動履歴を教師データとし、そこに気象や混雑、時間帯など犯罪を起こしやすい条件を割り出していってヒートマップを作るというのがデータサイエンスでできる適法な犯罪予測の限界点であって、これといって犯罪を起こさない人の位置情報や購買履歴をいくらたくさん集めても犯罪予測にはならず、昨日コンビニでコーヒーを買った人が今日コーヒーを買う確率ぐらいしか割り出せません。その確率が分かっても「こうすればもっとコーヒーを買ってくれるか」はデータサイエンスだけでは予測できませんし、北斗の拳の世界みたいに一日歩いてたら3回は事件に巻き込まれるような最頻状態の修羅でもない限り、そもそもレアな犯罪の発生を一時間単位で推測することなど不可能です。

 特に日本の場合、アメリカと違って犯罪を起こす市民の割合が極端に低く、そういうレアな犯罪を犯す人の行動をいくら食わせたところでレアな犯罪を起こす似たような人の行動を割り出すことは至難と言えます。そもそもデータサイエンスで犯罪抑止というのは、そのイベントの発生確率が低ければ低いほど悉皆データで村人の購買履歴や行動注視、位置情報を分析してもたいしたことは分からないのです。

 しかしながら、世の中には「データがあればきっといろんなことが分かるんだろう」と牧歌的に考える偉い人たちはたくさん存在します。また、そういう人たちほど出すべき予算の一割も出さないのに結果だけちゃんと出せという人ほど出世するのが世の常ですので、世の中のデータサイエンスにかかわる人たちがどんな気持ちでこの手の官公庁データ処理に向かい合って棲息しているのか知っておいてほしいという気持ちもないわけでもありません。

 参考までに、この手の犯罪予測において、もっとも効果があるのではないかと類推される個人に関するデータは、消費者金融の借り越し人物の照会とギャンブルの常習性と風俗、飲酒履歴が四天王です。重犯罪で言えば幼少時代に犬猫鳥などを殺害して補導されたかや、片親・虐待などの家庭環境の有無、凌辱・ゴア表現などの異常性愛などでほぼ説明がつくのではないかと思っています。なので、立正大学のようにこれらの犯罪抑止のために特に悪いことをしたことのない村人の行動を監視してデータを取り、それを分析することで犯罪抑止が可能になるという考え方そのものが大変な間違いを持っているし、また、犯罪を犯す傾向の高い個人が仮にプロファイリングされているのだとしても、その人が充分な理性をもって個人の感情(リビドー)の暴発を防ぐことができているのであれば、民主主義国家においては「問題のない国民」であり、個人を特定できる形での公権力を使った監視は禁忌であると言えます。

 もしもデータである程度の犯罪抑止を予算に見合った形で適法に行いたいのであれば、子どものころからの経年監視しかないんじゃないのと思うわけですが、おまえなんとなく基地 外で危険だからというプロファイリング的観点だけでデータサイエンスを使い監視したり、あるいは街中が監視カメラだらけになったりするのは適切じゃないような気はします。

 蛇足ながら、幼少期特段の問題を抱えていなくても、人間誰しもが、何らかの環境的要因がトリガーとなって、大変なことをやらかす確率と隣り合わせで生きています。本当の犯罪抑止は、幸せに生きることのできる環境を整えることに尽きます。後発的要因は概ね失業などの経済要因や職場・家庭でのパワハラなどの人間関係ストレスですので、犯罪を減らしたければみんなで声を掛け合って楽しい社会にしようねということ以外ないんですよね。

 いろいろと思うことはありますが、立正大学の皆さん大変お疲れさまでした。