Deep Dream | Nature | Photography | Music | Art

Nature | Photography | Music | Art

日々好奇心の趣くまま

サイト内の写真の使用ならびに無断転用を禁じます。

多忙のため随分更新が滞っていましたが、ようやく自由の身になってきました。
やっと思う存分アウトドアに…と思ったら秋雨前線の悪天続き。

というわけで、仕方がないのでしばらく手付かずだったプログラム作成やら工作をやっています。

最近Webのニュースを見ると、ロボット技術と人工知能の発展で近い将来に多くの人々の職が奪われるのでは? という感じの記事がよく目に付きます。
そのうち後者の人工知能の発展を支える技術の大御所がDeep Learningというもの。(らしい)

このDeep Learning、以前から興味があったのでこの際(素人なりに)ちょっとばかり突っ込んで勉強してみようと以前から考えていました。

今回ネタにするのが、表題のもの。最近技術発展が著しいDeep Learningの研究途上の副産物のようです。あまり実用性はないものの、キモくも美しい画像が次々と生成される。

ほんの二ヶ月ほど前にGoogleの研究チームがgithubに公開したもので、すでに世界中のギークがこれで作成した画像や動画を大量に公開しています。

例えばこんな感じ。(微グロ注意)

詳細やインストール方法・使い方は他所で多く語られているので割愛しますが、理解した範囲では以下のようなものです。

Deep Learningの主な用途である、画像認識の機能(つまり犬が写っている画像から犬を認識するとか)を何度もポジティブフィードバックをかけて元の画像を変容させていく。そうすると人間が想像もつかないサイケな絵柄になっていくわけです。

発表されて以来ずっと自分でも弄ってみたかったのですが、前提となる画像Deep Learning用のオープンソースソフトウェアであるCaffe動作環境の構築がかなり大変な上、多忙なこともありしばらく放置していました。
週末、ようやく半日ほど試行錯誤してなんとか動作できるところまで漕ぎ着けました。

deepdreamで生成された画像に関して、Webでの評価の多くは「グロい」とか「悪夢」とか言われているようなのだが、よく見ると多くの公開されている画像は「グロい」ことを故意に強調するような作品ばかりなのが一因と思われる。

生成された画像を観察していると、「グロい」原因と対策がいくつか思いつく。例えば。

・異型の動物(特に犬)が多く出現。ここを読んでみると、使用しているcaffe model(つまり事前に学習されたニューラルネットワーク、画像認識をする本体(?))作成の際に使用された画像が犬の写真に偏っていたのが原因らしい。

・目玉やツブツブ(これも犬写真に由来?)

・画像に見慣れた人間や動物、食物などがあるとちょっとした変形でも生理的に拒否反応が起きやすい。

・とにかく赤系の画像が多いと精神的にグロくなりやすい。

・デフォルトのcaffe modelであるbvlc_googlenetを使用するとツブツブや異型動物満載でグロくなりやすい。

・フィードバック回数が多くなるほどグロくなる傾向

逆にこのあたりを避けてやると、(受け取り方に個人差があるだろうけど…)さほどグロくない不可思議な魅力にあふれた画像が生成できる。

とりあえずやってみた。元画像は省略しますが、すべて自身で撮影したものです。







どの深さでフィードバックをかけるか次第で変容の形態も異なってくるようで、具体的なモノ(つまり犬とか)になる以前にフィードバックをかけてやるとより抽象絵画っぽくなって(個人的には)美しい画像になる。





おそらく、自分好みの画像で学習したcaffe modelを自前で作って使用したりするともっと面白い画像が生成できそうですが、今後そこまで追及するかどうかはまだわかりません。