Die automatische Zeitung

Die Suchmaschine Google hat ein neues Programm entwickelt: Es filtert und bewertet Nachrichten und Bilder anderer Medien. Die Redaktion ist ein Rechner, Redakteure sind nicht nötig

von DIETMAR BARTZ

Das „ganz Ungewöhnliche“ sei, sagen die Entwickler bei Google, „dass dieser Nachrichrichtendienst ausschließlich von Computeralgorithmen zusammengestellt wird“. Die politische oder weltanschauliche Ausrichtung der Meldungen oder Medien spiele keine Rolle: ebendeshalb seien die „Google News“ eine „verlässliche Informationsquelle für die wichtigen Themen des Tages“.

Noch befindet sich das Projekt befindet im Beta-Stadium. Nur unter news.google.com (nicht www.google.de) erscheint ein übersichtliches Portal ohne grafischen Wasserkopf, das Meldungen und Bilder nach den aktuellsten und wichtigsten Themen strukturiert. Links führen direkt zu den Quellen oder zu Verzeichnissen mit Fundstellen aus den letzten 30 Tagen. Alle 15 Minuten durchsucht Google die Quellmedien auf neuen Stoff. Konkurrenzlos schnell war damit nach den Terroranschlägen auf Bali ein Überblick über Fakten, Vermutungen und Gerüchte verfügbar. Mehr aber auch nicht: Wo bisher Journalisten über die Qualität von Medien entschieden, wählen jetzt Maschinen aus. 4.000 Medien und ein User allein zu Haus – bedeutet das den Anfang vom Ende jeglicher Nachrichtenqualität?

Doch gerade die Programmierer von Google wissen, dass im Internet schließlich doch die Qualität entscheidet. Der phänomenale Erfolg ihrer Suchmaschine beruht darauf, dass sie die Trefferlisten durch einen Popularitätsalgorithmus sortiert. Die „Relevanz“ einer Fundstelle ergibt sich aus der Anzahl der Links, die von anderen Internetseiten aus darauf verweisen, und der Häufigkeit der Klicks auf die Trefferlisten.

Dahinter steht die Idee einer kollektiven Evaluation, die nun auch auf den Nachrichtendienst angewandt wird. Über die Formel, mit der die Newsseiten generiert werden, sind zwar ebenso wenig Details zu erfahren wie über den Stammalgorithmus der Suchmaschine. Die Reputation der Quelle ist auch auch hier eine Funktion von Verlinkungen und tatsächlichen Klicks; hinzu kommen die Aktualität und die Zuweisung von Themen in insgesamt sieben Rubriken von den Weltnachrichten bis zum Sport.

Auch die Gruppierung ist weiterentwickelt worden. Entscheidend ist nicht die Frage, welche Bezeichnung am häufigsten vorkommt (dann wäre „Bush“ ständig der Aufmacher), sondern welche Begriffe in welchem Umfeld weiterer Begriffe auftauchen. „Zentroide“ von Schlagwörtern nennt Google-Projektmanagerin Marissa Mayer solche Kombinationen, die in den Nachrichtentexten in einer definierten Gewichtung vorkommen müssen, um den Sprung auf die Newsseite zu schaffen.

Zudem lernen die Rechner, wie neue Begriffe zu den bereits bekannten stoßen: Kommen keine weiteren substantiellen Informationen hinzu, bleiben die spätesten Nachrichten oder Wiederholungen draußen. Die Krise in Nordirland kann deshalb mal auf 400 Treffer kommen, während der Serienkiller von Washington wegen der mageren Nachrichtenlage nur mit 140 Fundstellen aufgenommen ist.

Wer bezahlt?

Voraussetzung für die Auswahl ist, dass die Rechner den Volltext der Meldungen erfassen – sonst wäre der Dienst nichts weiter als ein Überschriftensammler. Die Google-News ignorieren deshalb die Homepage des jeweiligen Onlinemediums, die für viele Internetauftritte die einzige Stelle ist, an der mit Werbebannern oder Hinweisen auf Online-Shops Geld zu machen ist. Ungeklärt bleiben außerdem urheberrechtliche Fragen. Einige Bilderdienste sind mit der Kopie der – sehr verkleinerten – Fotos einverstanden, andere beobachten einstweilen die Entwicklung. Bei den Textproduzenten überwiegt offenbar das Renommee, eine Story in den Google News zu haben, die Chance, mit den Page Visits neue Kunden zu gewinnen. So bieten selbst einige Bezahldienste die kostenlose Lektüre ihrer Texte via Google an, andere – etwa die New York Times – verzichten auf die umständliche Registrierung.

Besonders stolz ist Marissa Mayer auf Googles Lesetechnik. „Die Erfassung der Artikel hat sich als einer der schwierigsten Aspekte herausgestellt“, sagte sie dem Infodienst searchenginewatch.com. Denn die Vielfalt der Seitenlayouts und ihre Kleinteiligkeit sind viel schwerer zu verarbeiten als die üblichen Standardformate. Dennoch sind die Google News leicht kritisierbar: US-amerikanische Medien und Themen dominieren, und die Generierung der Nachrichten läuft auf ein Mainstreamprogramm heraus, das sich auf Tagesaktualitäten beschränkt. Google verhält sich wie ein Parasit, der die redaktionelle Arbeit anderer Medien umso intensiver verwertet, je populärer sie sind. Zumindest die Betaversion spült abgelegene Medien hoch, wenn sie früh mit Begriffen operieren, die in ein Google-Zentroid passen. Kommt der Nachrichtenfluss aber erst einmal in Gang, werden kleinere Medien verdrängt. Und auch die Leserresonanz führt zu Verzerrungen: Nach den Anschlägen von Bali dominierten auf den vorderen Rängen auch zweitrangige, schlecht informierte australischer Blätter, weil die meisten Opfer aus Australien stammten.

Neuer Standard

Altruistisch ist das Angebot nicht, sondern die Übertragung des Google-Geschäftsmodells auf einen weiteren Bereich: Offeriere deine Leistungen den Endkunden kostenlos, und dominiere damit das Geschäft. Setze Standards, die die Konkurrenz nicht erfüllen kann, und zwinge sie, deine Technik oder deine Leistungen einzukaufen.

Geld verdient Google nicht im „Business to Consumer“ (B2C), sondern im Business to Business (B2B). Es beliefert die Suchfunktionen von Yahoo, AOL und Netscape – ein soeben abgeschlossener Jahreskontrakt mit Yahoo bringt ca. 7,1 Millionen Dollar –, Google ist Sekundär- oder Tertiärlieferant von Suchergebnissen für fast alle anderen Suchmaschinen, und schließlich verkauft Google auch seine Technik selbst – allerdings nur an Intranets und Nichtkonkurrenten.

Google News könnte so ähnlich funktionieren: Zunächst wird der User gratis verwöhnt, dann verkauft Google die dafür nötige Technik allen Internetportalen, die es sich nicht leisten können, dahinter zurückzufallen. Interessant könnte auch die Vermarktung des Systems in verschiedenen anderen, allerdings viel kleineren Sprachräumen oder die sprachliche Mischung sein, aber dazu müssten die „Zentroide“ angepasst werden.

All das deutet darauf hin, dass noch einige Zeit vergehen wird, bis die traditionelle Onlineredaktion sich in ihrer Existenz bedroht fühlen muss. Und die Entwicklung etwa bei Yahoo läuft in genau die andere Richtung: Dort sollen demnächst die Suchergebnisse von Google und des handgeschriebenen Yahoo-Katalogs kombiniert werden, um die Stärken beider Seiten zu addieren.

bartz@taz.de