python + Keras で書かれた SSD (Single-Shot Multibox Detector) を試します。まずはちょろっと動かすだけなので、ググって一番上に出てくるこの記事 に従ってやってみます。

この記事で使っている実装は Keras の古い API で書かれていて、今の Keras だとうまく動いてくれないようです。ググると Keras 2 API 向けに修正したものを公開している人がいたのでそれを拝借します。ただ、この修正はコーディングスタイルの関係で妙に修正箇所が多くなっている(たとえば空行やインデントの追加や削除が混じってたりする)ので、同じ内容で修正箇所が少なくなるように書き換えたもの元のリポジトリの fork として置いておきました。

これで問題なく動くようになった(たぶん)ので、せっかくだから UtVideo のテストに使っている映像クリップからフレームを取ってきて認識させてみました。

真ん中の画像の鳥はそれなりに期待通り認識できているようですが、上の画像の走ってる人々は3人しか認識してませんし、下の画像の人々は全然認識できていません。解像度に問題があるのかモデルに合わない画像を認識させようとしたせいなのか…

それはともかく、認識させるためにはモデルを構築する前に自分でネットワークを組まなきゃいかんのですね。それをするには論文とか読んで知識を付けなきゃいかんかなぁ。

Trackback

no comment untill now

Add your comment now