顔認識について書いてみる

この記事はCyberAgent エンジニア Advent Calendar 19日目の記事です。

ハッピーホリデー！

秋葉原オフィスの @ceeflyer です。

秋葉原(UDX)もすっかり浮かれ模様ですね…

さて、ラボっぽいことを書こうと思い、今チャレンジしている画像処理のことについて書こうと思います。

とはいえ、画像処理(Computer vision)と一口に言っても、目的によって、下のようにいくつかの種類に分けることができるようです。例えば[1]の章立てでいうと、

画像変換(拡大・縮小など)
特徴検出(輪郭など)
画像結合(ストリートビューがいい例)
モーション検知
3次元画像復元
…
画像認識

物体検知
顔認識
物体認識
カテゴリ認識
コンテキスト(背景)・シーン認識

今回試してみるのが、代表的とも言える顔認識。

顔認識で有名な手法として Viola-Jones法[2]があげられます。

Viola-Jones法についての説明はGoogleにかけてみれば色々と出てくるとは思いますが、ここでは[3]のペーパーに載っていた方法で実装してみました。

ざっくり図に示すと、↓のような流れで特徴量を作って…

判別器を作る。

実装して…

人の顔では月並みなので、

の顔を学習させてみましょう。

こちらは顔ではない方のデータ。

実際に動かすと…

お！

お…？

(以上、パシャっとmyペットより)うーむ、単純に適用させるのは難しいようです。だいたい100枚あって数枚が顔に領域がかかるくらい。でもこのエントリはここで終わりです。すみません。まだまだ教えこまないといけないですね。

Viola-Jones法とは直接関連しないのですが、最近ではディープラーニングと呼ばれる、人間の脳神経をモデルにした画像判別法が流行のようです。

(参考: [4] (C) IEEE)

そちらのほうもぼちぼち進めている感じです。

…さて、ここまでのエントリにツッコミを入れたい方、はたまたマルチメディアを扱うR&D業務をしてみたい方、弊社で働いてみませんか？

ぜひお待ちしています。

では、よいお年を！

[参考文献]

[1] Szeliski, Richard. Computer vision: algorithms and applications. Springer Science & Business Media, 2010.

[2] Viola, Paul, and Michael Jones. "Rapid object detection using a boosted cascade of simple features." Computer Vision and Pattern Recognition, 2001. CVPR 2001. Proceedings of the 2001 IEEE Computer Society Conference on. Vol. 1. IEEE, 2001.

[3] Yi-Qing Wang, An Analysis of the Viola-Jones Face Detection Algorithm, Image Processing On Line, 4 (2014), pp. 128–148.

[4] Ciresan, Dan, Ueli Meier, and Jürgen Schmidhuber. "Multi-column deep neural networks for image classification." Computer Vision and Pattern Recognition (CVPR), 2012 IEEE Conference on. IEEE, 2012.

サイバーエージェント公式エンジニアブログ

CyberAgent Engineer Blog.

顔認識について書いてみる