Neue Datenplattform für Wikipedia: Fakten sollen zentralisiert werden
Die Online-Enzyklopädie Wikipedia startet ein neues Großprojekt: Basis-Fakten wie Geburtstage oder Einwohnerzahlen sollen in einer zentralen Datenbank gebündelt werden.
Mit einem neuen Projekt will der Wikipedia-Betreiber Wikimedia seinen ehrenamtlichen Autoren die Arbeit erleichtern: Unter dem Namen WikiData wird eine neue Daten-Ressource entstehen, die die Arbeit in der Wikipedia einfacher machen soll.
Statt Basis-Fakten in jeder einzelnen Sprachversion eines Artikels manuell einzutragen, werden sie künftig in einer zentralen Datanbank gepflegt - und automatisch in mehr als 250 Sprechen übersetzt.
Die Realisierung von WikiData ist ein Großprojekt für die Wikimedia Foundation. Denn das Grundprinzip des Artikelschreibens hat sich in den vergangenen zehn Jahren wenig geändert. "WikiData geistert bereits seit Jahren als Idee durch die Wikipedia", erklärt Wikimedia Deutschland-Geschäftsführer Pavel Richter gegenüber taz.de.
Doch nun will er Nägel mit Köpfen machen: Der deutsche Verein sucht elf neue Angestellte, die in den kommenden 12 bis 18 Monaten das Projekt realisieren sollen, darunter sechs Programmierer. Alleine im kommenden Jahr sollen 870.000 Euro in das Projekt gesteckt werden.
Wikimedia Deutschland arbeitet eng mit der US-Stiftung zusammen, ist aber ein eigenständiger Verein. "Die Prioritäten der Wikimedia Foundation sind die Entwicklung eines neuen Artikel-Editors, die Verfügbarmachung von Inhalten auf mobilen Endgeräten sowie der Aufbau eines neuen Datenzentrums", erklärt Richter. "Deshalb haben wir uns entschlossen, dieses Projekt federführend voranzutreiben."
Softwareentwicklung für Wikipedia ist komplex. Die Software der Plattform leistet zwar für den aktuellen Zustand der Enzyklopädie gute Dienste, tief greifende Veränderungen verlangen aber einen enormen Aufwand. So hatte die Wikimedia Foundation schon vor über fünf Jahren Arbeiten für einen neuen Artikel-Editor begonnen, der die Arbeit für Autoren einfacher machen soll - das erste Ergebnis soll erst Ende diesen Jahres vorliegen.
Macht die Community mit?
Doch es gibt nicht nur technische Probleme - auch die Community muss mitziehen. So sind bisher maschinelle Übersetzungen unter Wikipedianern verpönt. Statt einfach die mit 3,5 Millionen englischen Artikeln größte Wikipedia-Ausgabe in möglichst viele Sprachen zu übersetzen, setzt das Wiki-Prinzip darauf, dass sich Muttersprachler das Wissen selbst erarbeiten, das sie in die Enzyklopädie schreiben.
Aus der WikiData-Datenbank können aber keine kompletten Artikel geschöpft werden. Denn die Ontologie, sozusagen das Vokabular der Datenbank, kann nicht so vielfältig wie die menschliche Sprache sein und ist auf eindeutige Sachverhalte begrenzt. Die Einwohnerzahl von Berlin beispielsweise kann einfach aus einer Datenbank gelesen werden.
Welche Bedeutung die preußischen Könige für die Geschichte Berlins hatten, ist jedoch in Datenbanken kaum zu erschließen. Zunächst sollen die Informationen aus WikiData deshalb zunächst separat in Infokästen eingeblendet werden. Wie weit sich die automatischen Informationen in die Artikel integrieren lassen, muss im kommenden Jahr geklärt werden.
Auch wie die zentrale Ressource verwaltet wird, ist zudem eine kritische Frage. So gibt es mit Wikimedia Commons bereits eine zentrale Ressource für Bilder, Tondateien und Videos, die in allen Wikipedia-Ausgaben verwendet werden können. Doch während das Projekt in den ersten Jahren ohne Probleme lief, gibt es in letzter Zeit heftigen Streit um die Ausrichtung des Wissens-Sammelbeckens.
Weil sich in Wikimedia Commons allzu viele sexuelle oder auf andere Weise kontroverse Inhalte angesammelt hatten, plant die Wikimedia Foundation eine Art Jugendschutz-Filter. Nachdem gerade europäische Wikipedianer jedoch sich strikt gegen die Pläne aussprachen, wurden die Filterpläne erst einmal auf Eis gelegt.
taz lesen kann jede:r
Als Genossenschaft gehören wir unseren Leser:innen. Und unser Journalismus ist nicht nur 100 % konzernfrei, sondern auch kostenfrei zugänglich. Texte, die es nicht allen recht machen und Stimmen, die man woanders nicht hört – immer aus Überzeugung und hier auf taz.de ohne Paywall. Unsere Leser:innen müssen nichts bezahlen, wissen aber, dass guter, kritischer Journalismus nicht aus dem Nichts entsteht. Dafür sind wir sehr dankbar. Damit wir auch morgen noch unseren Journalismus machen können, brauchen wir mehr Unterstützung. Unser nächstes Ziel: 40.000 – und mit Ihrer Beteiligung können wir es schaffen. Setzen Sie ein Zeichen für die taz und für die Zukunft unseres Journalismus. Mit nur 5,- Euro sind Sie dabei! Jetzt unterstützen
meistkommentiert
Stockender Absatz von E-Autos
Woran liegt es?
Erfolg gegen Eigenbedarfskündigungen
Gericht ebnet neue Wege für Mieter, sich zu wehren
Energiewende in Deutschland
Erneuerbare erreichen Rekord-Anteil
Wahlprogramm der FDP
Alles lässt sich ändern – außer der Schuldenbremse
Tod des Fahrradaktivisten Natenom
Öffentliche Verhandlung vor Gericht entfällt
Lateinamerika und Syrien
Assads Freunde