↓これ読んで俺も透かしだけを抽出してみたくなった
ので抽出を実施
興奮してきたな
↓チャットGPT系の透かし例 PNGママ
↓Gemini系の透かしSynthID例 PNGママでは大きすぎたので50%縮小
PNGでアップしたけどブログサイト側で画像変換するかも?
gifとかjpeg変換入ると多少変化するかな。
ままええわ。
意外とチョロかったです。が、これが正確なwatermarkかは検証していないです
撮って出しなので鵜呑みにしないでね。
というか知りたい人は自分でやるよね。
この図はそもそも人間が判別できるレベルまで強調が入ってますし。
で、
色々疑問があったので当のチャットGPTとGeminiに解説してもらった。
勉強になるなぁ
ちょっと出かけるので後日追記
-----
主な特徴(AIモドキ曰く)
・不可視性: 人間の目には見えず、画像の画質や色味に影響を与えない
→この解説はおかしい。
画像に埋め込まれるので透明でない限り人間にも見える。
おそらく人間にはノイズに見えると言いたいのではないか?
→上記推測は正解
「ノイズの層」と「元の絵の層」が重なった状態で、
人間の脳はこれをノイズとして認識できないため、
(AIもどき曰く)透かしがないように見える。
→だから俺はそれを可視化したかった。
・堅牢性: 画像をスクリーンショットしたり、サイズを変更したり、
色を編集したりしても、透かしが検出可能な状態で残りやすい設計
→この点を追記
・1.ピクセルへの統合:
元画像の色や明るさに変化(0.1%程度の微細な強弱)を加えてパターンを練りこむ
・2.非局所性:
画像の一部にスタンプされているのではなく、
画像全体にデータを練りこむ
・3.復元性:
画像を切り抜いても、残った部分にこのパターンが維持されているため、
AIによる検出が可能
つまり元画像とwatermarkの分離は簡単ではない
再帰的な構造:
ドット単位で明るさや色が微調整され練りこまれている
データの同質性:
AI生成された時点でwatermarkが練りこまれており『元画像』は存在しない
watermarkは抽出できるが元画像のみは存在しない
-----
watermark分離で驚いたのは密度が高いこと。可視化で得た収穫だ。
変化率0.1%程度ということでもっとスカスカなwatermarkかと思ってた。
具体的には
(90度の格子ではなく)角度を付けた格子状の鎖的なwatermarkを想像してた。
実際は面。
この点についてAIモドキの回答は↓
1. 密度が高い理由:画像全体を保護するため
画像のどこを切り取られても、AI生成物だと判定できる。
画像全体のすべてのピクセルに対して、網の目のように細かく、
かつ均一に信号を練り込んでいます。
まぁそうですよね。
あと、Gemini系のwatermarkが純粋な?ノイズではなく、
意味のある画像に見えた点については
・生成プロセス由来の「癖」:
画像生成AI(モデル)が画像を組み立てる際、
計算の過程でどうしても発生してしまう「ノイズのようなパターン」が含まれる
だそうで。
このwatermarkから復元できる情報は非公式ですが
生成モデル識別
改変検出
偽画像追跡
ディープフェイク検知
拡散モデル固有癖の解析
→「これはGPT Image系で生成後にPhotoshop加工された」
レベルだそうで。
うーん。
IPとかIDとか生成者を特定するユニークな情報もありそうだけどな。
って、AIモドキに突っ込んだら
短い署名IDをwatermarkに練りこんで
OpenAI/Google側DBに
生成日時
アカウント
IP
モデル
プロンプト
を保存して照合することは技術的に難しくない。知らんけど。
だそうで。
そうなると
そこにアクセスすることで見えてくるものもあるよね。