画像内容によるネット検索は果たして可能なのか?

以前から関心を寄せている電子技術に「類似画像のネット検索」がある。これが可能になれば、例えば、どこを映したのか分からない写真から、風景や建物の名前を知ることができる。さらに極端にいえば、自分の顔に似た人の顔まで検索可能になる。また、美術や建築における類似した様式やモチーフを一瞬にして調べられる、という学術的用途も可能である。
現在、Googleには「イメージ検索」があるが、あくまでも文字に付随した画像が検索されるだけであって、画像の内容の検索ではない。というのも、画像内容の類似によるネット検索は、発想は単純だが、技術的にはきわめて困難であるからだ。

なぜか?

その最大の理由は、現在の画像の圧縮形式が、人間の目のようなゲシュタルト的な把握をしていないからである。画像内容の検索が電子技術のみならず、美学の領域にも関わってくるのはそのためである。
例えば最も多用される画像圧縮形式であるJPEGは、黒のデータの反復を省略するかたちで画像を圧縮している。その画像に含まれる黒の割合が高ければ高いほど、JPEGでの圧縮率も高くなる。JPEGが写真に適しているのはそのためである。
ところがJPEGは、画素のドットを(左上から右下に向かって)一つずつ圧縮していく方法であり、そこに「何が映っているのか」は一切、関与しない。つまりそこでは、ゲシュタルトの把握はおろか、図と地の区別も行われていないのである。
従ってJPEGの画像の類似性は黒の頻度の類似しか表さない。同じ形のものが映っていても、色が異なれば、別の画像として認識されるのである。これは人間の目が把握する「類似性」とは著しく乖離している。
画像の圧縮形式が現在のものに留まる限り、コンピューターを使って、類似画像の検索をするのは不可能である。

圧縮形式の話が分かりにくければ、Photoshopのフィルタを考えてみればよい。輪郭をくっきりさせるフィルタが実際には何をやっているかというと、色の連続によって人物なり物体の「エリア」を画定して、そのエリアを際立たせているのであって、輪郭そのものを取り出している訳ではない。だから結局は人が手作業で、輪郭をマウスでなぞって背景から切り離してやらねばはならないのだ。

ここには、デジタル的な処理では「連続した線」をポジティヴに捉えることができない、という根源的問題が含まれている。つまり輪郭線は「アナログ」だ、ということになる。「自然の事物には色があるだけで輪郭線はない」と昔から美術理論家が言っているが、なるほど輪郭とは人間の知覚の過程で作り出される主観的な効果である。だがカントの議論を引くまでもなく、色以上に輪郭がわれわれの視覚を形成しているのも事実である。そうなると、われわれの視覚のあり方に適合するような画像ファイルのデジタル処理は、到底実現不可能に思える。(相対的にしか定義されえないはずの「色彩」が、相対的であるがゆえにデジタルに数値化可能である、という逆説は何とも興味深い。)

そうしたなか、昨年頃から「類似した画像ファイルのソート」を謳い文句にした画像処理ソフトが登場してきた。これは画像の検索ではなく、手持ちのHDの画像フォルダの整理を目的にした技術であるが、必要とされるアルゴリズムは同じはずである。
ところがこれらのソフト(サムズプラス7.0、Pico、GraphicsCompareなど)はどうやら、画質を落とした別のファイルを作り(サムネイルを作るのが一般的)、それら低画質のファイル同士のデータを比較しているようである。そのため「どう見ても似ているのに類似ファイルとして扱われない」ファイルが出てくる(その逆、つまり「類似ファイルとされているのに似ていない」というケースは少ない)。結局、このアルゴリズムも、ドットの色を「力業」で比較していく方法であり、ゲシュタルトの把握にはなっていないのだ。
がっかりである。
どうやら、人間の目が行っているような「かたちの類似」をデジタル的に処理することは、現時点ではまだまだ不可能なようである。

だが、一つ可能性があるとすれば、「ウェーブレット変換」を用いて画像の輪郭的特徴を抽出する方法である。ウェーブレット変換は、フーリエ変換などとは違い、時間方向の情報も保持するため、対称性、直交性、連続性を数値化することができる。この変換方法を用いれば、画像とは独立したゲシュタルトを認識するアルゴリズムが生成可能であるため、ウェーブレット変換は最近のいわゆる「電子すかし」の技術の基礎となっている。よく考えてみれば、「すかし」の同一性の認識は、ゲシュタルトの認識に他ならない。

ということは、電子すかしが実現しつつある現在、画像内容によるネット検索が実現する日もそう遠くはないのか?
いずれにせよ、現在、目の認知の問題にもっとも真剣に取り組んでいるのは、美学者でも心理学者でもなく電子技術者であるようだ。