Google、動画内検索を可能にするディープラーニング採用APIのβ提供開始





Large-scale cluster management at Google with Borg




 



知ってる人からしたら、Googleの動画内検索APIと言われてもなぁと思うネタでもあると思う。


YouTubeも、元々は、目視や通報、そして、動画のサムネイルを照らし合わせる段階から違法アップロードを探しだし、最近では音声に到達し、ステレオ、モノラルなどより多くの対応をしている。



それでも、違法アップロードは絶えないのだが・・・

やる方も、自分でインフラも持たないで楽して稼ごうとしコジキみたいにあの手この手と考えてるので・・・


それは置いといて、仕組みとしては次の通りになる。


Mesos + FFMPEG + Image Convert Engine + GPU REST Engine + Deep Learning


他にも色々とテクニックがあり、AlexNet + Caffeeなども組み合わせたりする。


重要な点といえばMesos(正式にはApache Mesos)という名前のオープンソースでシリコンバレー界隈では、GoogleのBorgだろと言われてるのでその辺りを注目し、自分は色々と構築をしていた。


Nvidia GPU Support




MesosのGPUサポートの記事を見たときは、機械学習、人工知能系を志そうと思ってたものからすると、とうとう来たかと思ったしPascalでのディープラーニング対応なんてシンギュラリティなんてどうでもいいや、ここがそうだろと思ったぐらいで、なんともいえない喜びでもあった。


まぁ、自分としてはちょうどいいタイミングに出てもくれたので、この辺の論文はまだ日本でも少ないし書くリストに入れようと思っている。


動画に関してあまり話した事はないので動画の事を知らんだろうと思う人向けに書くが、自分はその昔リアルタイム動画配信のガラケー版を作っていて、その後ある大手の会社に知らないうちに持って行かれたのだが(駆け出しの頃だったので知らずやらされていたので損した。)、当時はガラケーにリアルタイム配信する動画配信サーバはうちともう1社ぐらいでニコニコ動画は後発であった。


遅延率争いではマジでやると勝てたのだがお金がかかるのでとほどほどにさせられた。


それぐらいだったので、とある事から関連を持った、お役所関連にも特許をなんで取らなかったと言われたぐらい無頓着でもあった。

※個人的にはオープンソースの人間なのでそういう考えもなく意味分からない


ぶっちゃけ、お金よりも開発できる環境などが欲しかったのでその辺どうでも良かった。


で、動画元年YouTuberが出てきてなんだこれ・・・という感じもあったが、やっぱり国外先端だなぁと思うし、情報の入り方は最短でも1年後に日本に入って来て、前兆からすると5〜10年の開きもあり、この差を考えるとやっぱり日本はと思ってしまう。


これだけ、情報社会になったのになんでこんなに遅いのか、未だに理解できないが日本は好きなのでしばらくはと考えている。


日本人としての意地もあるので・・・