画像検索技術に関するまとめ資料

画像検索についていろいろとちょっとした実装や調査をしていました。
そろそろ資料等をまとめておかないと忘れそうなので書いておきます。


まずさっそくですが「画像を検索する」と一言でいっても、
それには以下のような種類があり、対象や方法は様々です。

  • 類似画像検索 …… 対象画像から特徴を抽出し類似した画像を検索する
  • 特定物体認識 …… 単一の対象画像から特徴を抽出しその物体と同じモノを認識
  • 一般物体認識 …… 複数の対象画像から特徴を学習しその物体と同じ種類を認識


「類似画像検索」は Google Goggle などが有名で、「一般物体認識」は笑い男ツールなどの顔認識でよく知られていますね。「特定物体認識」はまだそこまでポピュラーに使われてませんが、東のエデンシステムなどはまさにこれです(笑)。


さてではどのような方法で検索を行うかということですが、ここで画像の特徴といっている、これを使います。特徴というのは対象の画像の色や輪郭で、これをベクトル化したものが、似ていると、同じモノだったり類似した画像だったりと判定するわけです。この特徴の取り方には当然、何種類もの方法がありまして、代表的な方法としては以下のものがあり、この特徴量を取得、比較して計算することによって画像の類似検索が出来るようになります。
(ここにあげた局所特徴量のうち SURF と SIFT は特許が取得されており、パテントフリーなのは Star_Detector のみなので注意)

  • 局所特徴量 画像の一部分から特徴を取得 …… SURF, SIFT, Star_Detector
  • 大域特徴量 画像の全体像から特徴を取得 …… CCV, Haar-Like, HoG, HI


なお少々画像検索からは脱線しますが「一般物体認識」の場合は、その種類を勉強し、これは顔だ!等判定する必要があるため、その特徴を何個も読ませてそのパターンを学習させる必要があります。これは機械学習と呼ばれる分野で以下のような方法を利用できます。

  • SVM, AdaBoost, HMM, NN, BN


上記の特徴量の類似度計算で、一応、画像検索は出来るわけですが、すべての画像の特徴を比較していては計算爆発をおこすため以下のような方法で検索インデックスを作る必要があります。

  • 地図によるインデックス …… Bd-Tree, R-Tree
  • 距離によるインデックス …… LSH, NNS


それぞれのベクトルの近似度から地図を製作してインデックスを構築する方法、距離関数をもとに構築する方法というのが一般的なようです。

以上で簡単な技術のまとめを終わります。


以下の資料を参考にさせてもらいました。
ありがとうございました。


大域特徴量の記事
http://d.hatena.ne.jp/nowokay/20081007

局所特徴量の記事
http://mm.cs.uec.ac.jp/IPSJ-TCVIM-Yanai.pdf
http://www.vision.cs.chubu.ac.jp/SIFT/PDF/SIFT+a_LN.pdf
http://pr.willowgarage.com/wiki/Star_Detector
http://d.hatena.ne.jp/visual-photo-search/20100220/1266662816
http://gihyo.jp/dev/feature/01/opencv
http://d.hatena.ne.jp/mjt/20090128/p2

LSH に関する記事
http://wiki.livedoor.jp/few01/d/060108%20Locality-Sensitive%20Hashing%A4%CE%BC%C2%C1%F5%A4%AC%B0%EC%C3%CA%CD%EE
http://ameblo.jp/th0083/entry-10269427807.html
http://nlp.sfc.keio.ac.jp/~aihara/nlp.html
http://www.slideshare.net/yaruki_nil/lsh
http://alpha.mixi.co.jp/blog/?p=1896

画像検索全般記事
http://d.hatena.ne.jp/aidiary/20091003/1254574041
http://d.hatena.ne.jp/aidiary/20091018/1255862734
http://www.m.cs.osakafu-u.ac.jp/publication_data/1054/paper.pdf
http://blogs.yahoo.co.jp/yjlab_blog/19440125.html