顔認識について書いてみる | サイバーエージェント 公式エンジニアブログ
ハッピーホリデー!

秋葉原オフィスの @ceeflyer です。


秋葉原(UDX)もすっかり浮かれ模様ですね…
さて、ラボっぽいことを書こうと思い、今チャレンジしている画像処理のことについて書こうと思います。
とはいえ、画像処理(Computer vision)と一口に言っても、目的によって、下のようにいくつかの種類に分けることができるようです。例えば[1]の章立てでいうと、
  • 画像変換(拡大・縮小など)
  • 特徴検出(輪郭など)
  • 画像結合(ストリートビューがいい例)
  • モーション検知
  • 3次元画像復元
  • 画像認識
    • 物体検知
    • 顔認識
    • 物体認識
    • カテゴリ認識
    • コンテキスト(背景)・シーン認識
今回試してみるのが、代表的とも言える顔認識。

顔認識で有名な手法として Viola-Jones法[2]があげられます。
Viola-Jones法についての説明はGoogleにかけてみれば色々と出てくるとは思いますが、ここでは[3]のペーパーに載っていた方法で実装してみました。
ざっくり図に示すと、↓のような流れで特徴量を作って…


判別器を作る。

実装して…

人の顔では月並みなので、の顔を学習させてみましょう。

こちらは顔ではない方のデータ。

実際に動かすと…


お!

お…?

(以上、パシャっとmyペットより)うーむ、単純に適用させるのは難しいようです。だいたい100枚あって数枚が顔に領域がかかるくらい。でもこのエントリはここで終わりです。すみません。まだまだ教えこまないといけないですね。

Viola-Jones法とは直接関連しないのですが、最近ではディープラーニングと呼ばれる、人間の脳神経をモデルにした画像判別法が流行のようです。

(参考: [4] (C) IEEE)


そちらのほうもぼちぼち進めている感じです。
…さて、ここまでのエントリにツッコミを入れたい方、はたまたマルチメディアを扱うR&D業務をしてみたい方、弊社で働いてみませんか?
ぜひお待ちしています。
では、よいお年を!
[参考文献]
[1] Szeliski, Richard. Computer vision: algorithms and applications. Springer Science & Business Media, 2010.
[2] Viola, Paul, and Michael Jones. "Rapid object detection using a boosted cascade of simple features." Computer Vision and Pattern Recognition, 2001. CVPR 2001. Proceedings of the 2001 IEEE Computer Society Conference on. Vol. 1. IEEE, 2001.
[3] Yi-Qing Wang, An Analysis of the Viola-Jones Face Detection Algorithm, Image Processing On Line, 4 (2014), pp. 128–148.
[4] Ciresan, Dan, Ueli Meier, and Jürgen Schmidhuber. "Multi-column deep neural networks for image classification." Computer Vision and Pattern Recognition (CVPR), 2012 IEEE Conference on. IEEE, 2012.