Bessere Bildersuche mit Google
Seit mehr als einem Jahrzehnt versucht man, Bilder nicht nur nach Begriffen, sondern nach ihrem Inhalt zu ordnen. Content-based Image Retrieval heisst die Technik unter Forschern. Zum Leidwesen der Beteiligten haben sich die grundlegende Probleme bislang nicht lösen lassen. Denn Maschinen können die meisten Dinge, die Menschen in Sekunden erfassen, bisher nicht erkennen.
Wenn sich nun aber Google dem Problem widmet, scheint es, als sei man einer Lösung nahe. A Google Prototype for Precision Image Search titelt die NY Times und Golem schreibt von einer neuen Bildsuche. Das entspricht nicht ganz den Fakten. Was die beiden Forscher Yushi Jing und Shumeet Baluja auf der WWWConference in Beijing unter dem Titel PageRank for Product Image Search (pdf) vorgestellt haben, ist eher ein Versuch, dem großen Problem auszuweichen. Und dieses Vorgehen hat durchaus etwas für sich.
Das große Problem lag darin, dass man immer wieder zwanghaft versucht hat, vom ganzen Bild auszugehen und es von Grund auf aufzuschlüseln. Das hat zu keinem Erfolg geführt.
Deshalb wollen Jing und Baluja nicht Bilder generell erkennen, sondern nur die bestehende Google Bildsuche mit visuellen Merkmalen verbessern. Und dazu benutzen sie einen klugen, aber einfachen Trick.
By treating images as web-documents and their similarities as probabilistic hyperlinks, we estimate the likelihood if images visited by a user traversing through these visual hyperlinks.
Sie behandeln Bilder wie Webseiten und beschränken sich dann nur auf einige wenige auffindbare Ähnlichkeiten. Diese Ähnlichkeiten behandeln sie wie Links. Das versetzt sie in die Lage, Bilder auf die gleiche Weise zu bewerten wie Googles Suchmaschine Webseiten.
Zur Optimierung der Ergebnisse erstellen sie zuerst eine visuelle Rangliste. Diese wird dann mit dem herkömmlichen Google-Resultat verknüpft, um möglichst viele irrelvante Ergebnisse auszuschließen.
Was in vielen Artikeln als Durchbruch der Bildsuche dargstellt wurde, ist tatsächlich eher ein kleiner Schritt. Aber er führt in die richtige Richtung. Anstelle des Versuchs, Bilder global zu erkennen, verfolgen Jing und Baljua die Strategie, machbare lokale Lösungen in vorhandene Anwendungen zu intergieren.
____________
Bild: Jing / Baluja: PangeRank for Google Image Search: Figure 5: Similarity graph generated from the top 1000 search results of “Mona-Lisa.”The largest two images
contain the highest rank.