Schluss mit Schema F

INTERNET Mit Schema.org und dem semantischen Web sollen Suchmaschinen verstehen lernen

Das Google der Zukunft soll Begriffe nicht nur auslesen, sondern auch einordnen und verarbeiten

Wörter haben oft mehrere Bedeutungen. Einige kennen den „Kanal“ als künstliche Wasserstraße, andere vom Fernsehen. Die Waage kann zum Erfassen des Gewichts nützlich sein oder zur Orientierung auf der Horoskopseite. Casablanca ist eine Stadt und ein Film zugleich.

Wo Menschen mit der Zeit Bedeutungen unterscheiden und verarbeiten lernen, können dies Suchmaschinen von selbst nicht. Stets listen sie dumpf hintereinander weg alles auf, was sie zu einem Thema finden.

Damit das nicht so bleibt, haben sich nun Google, Yahoo und die zu Microsoft gehörende Suchmaschine Bing zusammengetan, um der Suche im Netz mehr Verständnis zu verpassen. Man spricht dabei auch von einer „semantischen Suche“. Das Ergebnis heißt Schema.org. Wer die Webseite einmal besucht, sich ein wenig in die Unterstrukturen hereinklickt und weder Vorkenntnisse im Programmieren noch im Bereich des semantischen Webs hat, wird sich überfordert und gelangweilt wieder abwenden.

Doch was hier entstehen könnte, hat das Zeug dazu, Teile des Netzes und speziell die Funktionen von Suchmaschinen mittel- oder langfristig zu verändern. „Große Player sind dabei, sich auf Standards zu einigen“, sagt Daniel Bahls, Spezialist für Semantische Technologien beim ZBW Leibniz-Informationszentrum Wirtschaft in Hamburg. „Die semantischen Technologien stehen schon seit Jahren im Raum und wurden bisher nur im kleineren Kontext verwendet.“

Denn Schema.org lädt Entwickler, Forscher, die Semantic-Web-Community und am Ende auch alle Betreiber von Websites dazu ein, an der Umgestaltung der Suche im Netz mitzuwirken. Inhalte von Websites sollen mit einem speziellen, aber einheitlichen Vokabular für die Crawler – die Analyseprogramme der Suchmaschinen – gekennzeichnet und aufbereitet werden.

Indem Schlagworte, sogenannte Tags, in den für Normal-User nicht sichtbaren Teil des Codes von Websites eingebettet werden, sind Suchmachinen nicht mehr so sehr auf die Analyse der natürlichen Sprache angewiesen, um Texte inhaltlich zu erfassen. Im Blog ZBW Mediatalk wird dies als „Semantic Web light“ bezeichnet – ein semantisches Web auf niedrigster Ebene. Aber selbst das werde „schon viel bewirken“, meint Bahls. „Das semantische Web wird sich über die nächsten Jahrzehnte evolutionär weiterentwickeln.“ Einen „Abschluss“ werde es nie geben, „da eine einheitliche Formalisierung von Begrifflichkeiten auf feiner Stufe kaum möglich ist“.

Die Ergebnisse aus Schema.org würden „zeitnah“ in die Suchmaschine integriert, „denn einen Zeitplan“ gebe es nicht, so Stefan Keuchel, Pressesprecher von Google Deutschland. Bis das so weit ist, hilft der Verweis von Daniel Bahns auf die bereits existierende semantische Suchmaschine Sig.ma. Geschwindigkeit und Menge der Ergebnisse nach einer Suchanfrage spielen hier keine Rolle. Sig.ma sammelt seine Informationen allein im Bereich des semantischen Webs und listet nach einer Anfrage alles Bekannte strukturiert auf. MAIK SÖHLER