仕事術 拡散意図を理解すれば生成AIの真偽判定ができる | 特選街情報 NX-Station Blog

特選街情報 NX-Station Blog

特選街情報 NX-Station Blogは30年以上の製品選定の経験に基いてパソコン、デジモノ、家電の購入の経験、そのほか日々の記録のブログです。製品についての所感、評価、クーポン&特価情報やスペックの比較をしています。

本日の仕事術は 拡散意図を理解すれば生成AIの真偽判定ができる をお届けします。最近の国や報道機関の論調は「生成AIが作り出す動画像が高精細になってきてフェイク(偽)を見破るのが難しくなっている、何らかの規制をして対策が必要である」というものと「著作物の学習データの利用についてのルールを作るべき」という大きな2つの流れがあります。

 

 

グーグルなどの検索エンジンがクロールによって情報を収集して支配的な立場を築いたように、生成AI各社はAIの機械学習用のデータをクロールしています。公開されているニュースや書籍の要約を生成AIにリクエストする人が増えて、ニュースサイトへのアクセスと記事閲覧の有料契約が減少しているなど影響が出始めています。こうした影響を問題視して規制や補償の話が出てくるのは当然の流れと言えます。

 

著作物を提供するメディア事業者は第三者の生成AI用に学習されるのを防ぐためにWebページでの一般公開を止めて、会員向けWebページや専用アプリでの閲覧に切り替えています。そしてメディア事業者自身が生成AIを利用して記事の生成を始めています。

 

著作権法第三十条の四の「著作権者の利益」を考慮すると、有料契約者向けに提供するようにしていれば著作物の生成AIへの利用を制限することができ、もしも使われたときには不利益分の補償を求めやすくなります。こうした流れから、リード文といった冒頭のコンテンツを一般公開して、続きは登録会員のみとする方式が増えているのです。

 

生成AIによって生み出されるフェイクニュースはニュース番組や記事の体裁を整えてあり、一見すると元となったニュース番組や記事との区別が難しいです。しかしそのフェイクニュースを拡散しようとしている意図を考えると真偽判定は難しくありません。例えば、選挙の時期に政党や候補者の評判を下げるような内容のニュースはフェイクです。その時期に公平性が保てない形で報道することがあり得ないからです。

 

また、組織や著名人の名を騙った発信も偽ニュースや偽広告ではよく使われる手口です。本人になりすましをして発信する場合と本人の言葉として発信する場合の手口があり、前者はアカウントが本人の物か後者は本人の言葉の入手経路や著名人と発信者の関係性から真実かどうかを確認します。本人の写真や音声を基にAIで精巧な動画を生成することができるため、すでにインタビュー形式や声明のような動画であっても本物かどうかはチェックが欠かせません。記者発表会での動画であれば音声データは同じ発言で、映像は会場の報道各社の撮影位置から撮影動画に違いがあるのが正常です。使用機材の違いでノイズなどに特徴がでるので映像の一部を切り取ったり、付加していたらおかしくなります。

 

テレビや動画サイトが発信元とみられる場合、X/Twitterで拡散されている画像が1ドットも違わないで話題になっている場合に偽情報の拡散の可能性が非常に高いです。大抵の場合はアカウントの属性、今までのポストの新規投稿とリポストの比率、ポストしている時間帯から不審点が見つかります。新規投稿の場合には多くの人が伝達しようとスクリーンショットやスマホでの撮影などをした場合には様々な解像度、画質になるのが普通です。

 

ほかにもちょうどよすぎるタイミングで取り上げられる話題にも注意です。ターゲットが多数になると見込めるイベントをサイバー犯罪者は積極的に収集します。そして、金銭や個人情報を搾取するためのわなを仕掛けます。確定申告の時期の偽の還付金のeメールやSMS メッセージ、年金支給日や給与日・ボーナス時期の銀行口座の偽の凍結連絡、人気ゲームタイトルの発売日の偽の荷物の不在連絡などです。

 

イベントの無い平常時には引っ掛かりやすそうな人(すぐにクリックして表示に影響されやすい人)を見つけるために、ネット広告を使ってクイズ、○○診断、IQテストといったWebページへの誘導も行っています。「9割が知らない○○」のような一見すると知っておいて自分が有利になりそうなトピックも悪質情報につながっています。共通するのは馬鹿だと思われたくないとコンプレックスを抱えている人を狙うというところです。賢い人ほど自分自身は世の中で知らないことがたくさんあることを認識しています。先行者利益を否定するつもりはありませんが他の人よりも早く知っておきたいという心理は偽情報を受け入れてしまいやすくなるので判定スキルを伴わないと危険です。

 

偽情報を広めようとする勢力に対して、集合知を活かしてファクト・チェックをする動きも活発化してきていてX/Twitterでは誤解を招く可能性があるツイートに対し「コミュニティノート」という他のユーザーから指摘できる機能も実装されています。

 

情報の真偽判定のためにもまずは、なぜその情報がこのタイミングで発信されているのかを考えましょう。次にその情報は誰が発信しているのか、だれが拡散しているのかを調べましょう。発信者の属性、経歴を調べましょう。過去に同じような発信がなかったか調べましょう。

 

ということで、発信意図、あるいは拡散意図を理解すれば生成AIの真偽判定は容易いのです。

 

近年、なりすましの情報発信が起きないように情報に「電子透かし」を付加することで発信者の証明と改ざんされていないことを保証する仕組みの研究が進められています。オリジネーター・プロファイル(OP:Originator Profile)と名付けて推進しようとしている団体があります。ただ目指している目的が発信者の真正性であり偏りを感じます。仕様案や概念実装用のサンプルコードが公開されていない点など閉鎖的な集団に見えます。インターネットへの対応が遅れているオールドメディアの既得権益者の組合なので技術的にも劣りそうです。

 

暗号資産にあるような匿名性を担保したまま情報の伝達経路を記録するブロックチェーン技術を活用した情報プラットフォームを構築するほうがインターネットとの親和性が高く、誰にでも発信者、伝達者としての権利を行使できる公平な社会を実現できると考えます。

 

今すぐできるなりすましを防ぐための対策には組織や個人としてSNSのアカウントを取得し、アイデンティティを確立するため適度に情報発信をしておく必要があります。なお、一般の受信者は権威主義的なところがあり、発信内容が真実かどうかよりも誰が発信しているかの方が内容を信じやすいと言われています。偽情報を流す勢力が本人になりすまして長い年月をかけて多くの情報発信をして、その大部分が真実でSNSでつながる周辺のアカウントまで作りこんできたら紛れ込まされた偽情報を人が判定するのは困難になるでしょう。

 

 

■関連リンク

AIと著作権 [文化庁]

 

著作権法 [法令検索 e-Govポータル]

(著作物に表現された思想又は感情の享受を目的としない利用)
第三十条の四 著作物は、次に掲げる場合その他の当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合には、その必要と認められる限度において、いずれの方法によるかを問わず、利用することができる。ただし、当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。
一 著作物の録音、録画その他の利用に係る技術の開発又は実用化のための試験の用に供する場合
二 情報解析(多数の著作物その他の大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の解析を行うことをいう。第四十七条の五第一項第二号において同じ。)の用に供する場合
三 前二号に掲げる場合のほか、著作物の表現についての人の知覚による認識を伴うことなく当該著作物を電子計算機による情報処理の過程における利用その他の利用(プログラムの著作物にあつては、当該著作物の電子計算機における実行を除く。)に供する場合

 

OP - Originator Profile 概要説明資料 [総務省 オリジネーター・プロファイル技術研究組合 作成]