Neue Datenplattform für Wikipedia: Fakten sollen zentralisiert werden

Die Online-Enzyklopädie Wikipedia startet ein neues Großprojekt: Basis-Fakten wie Geburtstage oder Einwohnerzahlen sollen in einer zentralen Datenbank gebündelt werden.

Egal, ob Englisch oder Portugiesisch: Basis-Fakten der Wikipedia sollen künftig in allen Sprach-Varianten aus der gleichen zentralen Datenbank kommen. Bild: dpa

Mit einem neuen Projekt will der Wikipedia-Betreiber Wikimedia seinen ehrenamtlichen Autoren die Arbeit erleichtern: Unter dem Namen WikiData wird eine neue Daten-Ressource entstehen, die die Arbeit in der Wikipedia einfacher machen soll.

Statt Basis-Fakten in jeder einzelnen Sprachversion eines Artikels manuell einzutragen, werden sie künftig in einer zentralen Datanbank gepflegt - und automatisch in mehr als 250 Sprechen übersetzt.

Die Realisierung von WikiData ist ein Großprojekt für die Wikimedia Foundation. Denn das Grundprinzip des Artikelschreibens hat sich in den vergangenen zehn Jahren wenig geändert. "WikiData geistert bereits seit Jahren als Idee durch die Wikipedia", erklärt Wikimedia Deutschland-Geschäftsführer Pavel Richter gegenüber taz.de.

Doch nun will er Nägel mit Köpfen machen: Der deutsche Verein sucht elf neue Angestellte, die in den kommenden 12 bis 18 Monaten das Projekt realisieren sollen, darunter sechs Programmierer. Alleine im kommenden Jahr sollen 870.000 Euro in das Projekt gesteckt werden.

Wikimedia Deutschland arbeitet eng mit der US-Stiftung zusammen, ist aber ein eigenständiger Verein. "Die Prioritäten der Wikimedia Foundation sind die Entwicklung eines neuen Artikel-Editors, die Verfügbarmachung von Inhalten auf mobilen Endgeräten sowie der Aufbau eines neuen Datenzentrums", erklärt Richter. "Deshalb haben wir uns entschlossen, dieses Projekt federführend voranzutreiben."

Softwareentwicklung für Wikipedia ist komplex. Die Software der Plattform leistet zwar für den aktuellen Zustand der Enzyklopädie gute Dienste, tief greifende Veränderungen verlangen aber einen enormen Aufwand. So hatte die Wikimedia Foundation schon vor über fünf Jahren Arbeiten für einen neuen Artikel-Editor begonnen, der die Arbeit für Autoren einfacher machen soll - das erste Ergebnis soll erst Ende diesen Jahres vorliegen.

Macht die Community mit?

Doch es gibt nicht nur technische Probleme - auch die Community muss mitziehen. So sind bisher maschinelle Übersetzungen unter Wikipedianern verpönt. Statt einfach die mit 3,5 Millionen englischen Artikeln größte Wikipedia-Ausgabe in möglichst viele Sprachen zu übersetzen, setzt das Wiki-Prinzip darauf, dass sich Muttersprachler das Wissen selbst erarbeiten, das sie in die Enzyklopädie schreiben.

Aus der WikiData-Datenbank können aber keine kompletten Artikel geschöpft werden. Denn die Ontologie, sozusagen das Vokabular der Datenbank, kann nicht so vielfältig wie die menschliche Sprache sein und ist auf eindeutige Sachverhalte begrenzt. Die Einwohnerzahl von Berlin beispielsweise kann einfach aus einer Datenbank gelesen werden.

Welche Bedeutung die preußischen Könige für die Geschichte Berlins hatten, ist jedoch in Datenbanken kaum zu erschließen. Zunächst sollen die Informationen aus WikiData deshalb zunächst separat in Infokästen eingeblendet werden. Wie weit sich die automatischen Informationen in die Artikel integrieren lassen, muss im kommenden Jahr geklärt werden.

Auch wie die zentrale Ressource verwaltet wird, ist zudem eine kritische Frage. So gibt es mit Wikimedia Commons bereits eine zentrale Ressource für Bilder, Tondateien und Videos, die in allen Wikipedia-Ausgaben verwendet werden können. Doch während das Projekt in den ersten Jahren ohne Probleme lief, gibt es in letzter Zeit heftigen Streit um die Ausrichtung des Wissens-Sammelbeckens.

Weil sich in Wikimedia Commons allzu viele sexuelle oder auf andere Weise kontroverse Inhalte angesammelt hatten, plant die Wikimedia Foundation eine Art Jugendschutz-Filter. Nachdem gerade europäische Wikipedianer jedoch sich strikt gegen die Pläne aussprachen, wurden die Filterpläne erst einmal auf Eis gelegt.

Einmal zahlen
.

Fehler auf taz.de entdeckt?

Wir freuen uns über eine Mail an fehlerhinweis@taz.de!

Inhaltliches Feedback?

Gerne als Leser*innenkommentar unter dem Text auf taz.de oder über das Kontaktformular.

Bitte registrieren Sie sich und halten Sie sich an unsere Netiquette.

Haben Sie Probleme beim Kommentieren oder Registrieren?

Dann mailen Sie uns bitte an kommune@taz.de.