Jede*r braucht Zugang zu Wissen

Wikidata hat es sich zum Ziel gesetzt, all das Wissen der Menschheit in einer Datenbank zu speichern und es Maschinen sowie Menschen zur freien Verfügung zu stellen. Was im ersten Moment sehr positiv klingt, birgt jedoch auch Risiken für unsere Gesellschaft. Lydia Pintscher, die an Wikidata mitarbeitet, gibt uns einen Einblick in das Projekt der Wikimedia Foundation.

 

Wikidata

Urheberin: Lydia Pintscher / https://www.wikidata.org/wiki/User:Lydia_Pintscher_(WMDE)#/media/File:Lydia_Pintscher_-_1.jpg / Lizens: CC BY-SA 3.0.

Am 22.11.2017 stellte Lydia Pintscher, Product Managerin bei Wikidata, im Rahmen der Ringvorlesung Open Technology for an Open Society Wikidata vor. Lydia Pintscher, die seit Beginn von Wikidata am Projekt mitarbeitet, beschreibt Wikidata als eine Plattform (Wissensdatenbank), die von einer Community bearbeitet und aktuell gehalten wird. Dieses Prinzip ist uns durch Wikipedia vertraut – dem bekanntesten Projekt der Wikimedia Foundation. Wikidata ermöglicht vor allem Maschinen Zugang zu diesem Wissen. Aus diesem Grund weiß
zum Beispiel Siri, dass die Nationalhymne Bulgariens „Dear Motherland“ ist.

Wikidata ist nicht das erste Projekt dieser Art. Googles Freebase war ein ähnliches Vorhaben, bis Google entschied, dessen Daten in Wikidata zu migrieren und Wikidata finanziell zu unterstützen[1]. Auch gibt es andere Projekte, wie z. B. DBpedia. Doch aufgrund der Erfahrungen der Wikimedia Foundation im Bereich der Community Projekte wurde Wikidata schnell zum Platzhirsch in diesem Gebiet. Inzwischen werden ein Drittel aller Edits in Wikimedia Projekten auf Wikidata vorgenommen und es werden täglich mehr. Was Wikidata auszeichnet, ist unter anderem, dass diese Daten für alle frei zugänglich und nutzbar sind. Besonders betonte Lydia Pintscher in ihrem Vortrag auch den Aspekt: „Die Welt ist wirklich kompliziert!“. Wikidata versucht nicht die Wahrheit zu finden oder festzulegen, sondern Wissen in all seiner Breite zur Verfügung zu stellen, unter Voraussetzung von Quellen. Wikidata kann mehrere sich widersprechende Informationen darstellen und diese zur Verfügung stellen.

Klingt gut und praktisch. Wikipedia bezieht Teile ihrer Informationen aus Wikidata, siehe die Infoboxen in vielen Wikipedia Artikeln. Ebenfalls können nun endlich Informationen in Wikipedia über mehrere Sprachen hinweg synchronisiert werden. Fakten ist es egal, welche Sprache genutzt wird, um sie zu beschreiben – es bleiben dieselben Fakten. Doch wie gut funktioniert der Ansatz, dass eine Community Daten zu diesen Fakten erzeugt und darüber entscheidet, welche Daten korrekt und welche falsch sind? Und dass nun diese Daten von Maschinen lesbar sind? . Was sind die Gefahren, die sich für unsere Gesellschaft auftun, was die Vorteile? Und wie geht Wikidata damit um?

 

Chancen und Herausforderungen
Menschen und Wikidata

Diejenigen die Wikidata bereits kennen und sich einen Datensatz angeschaut haben, können nicht unbedingt direkt etwas damit anfangen. Wer allerdings technisches Verständnis mitbringt und programmieren kann, der sieht das Potenzial, welches Wikidata bietet. Doch welcher Anteil der Bevölkerung kann programmieren und bringt ausreichendes Verständnis mit, um diese Daten zu nutzen? Ich als Informatikstudent, ja. Meine Eltern, denen das technische Verständnis dafür fehlt, nicht wirklich. So bleibt Wikidata nur für einen kleinen Teil der Bevölkerung zugänglich und direkt nutzbar. Doch wenn nur wenige Menschen diese Daten direkt nutzen können, bleiben dann nicht diejenigen auf der Strecke, die in unserer Gesellschaft sonst auch auf der Strecke bleiben? Diejenigen, die nicht die nötigen Ressourcen haben, können mit dem frei zugänglichen Wissen nichts anfangen. Dazu können wir uns ein interessantes Beispiel anschauen, mit dem Michael Gurstein in seinem Artikel Empowering the Empowered or effective data use for everyone[2] die Gefahren von Open Data erläutert.

Dort geht es um Bangalore, eine Stadt in Indien, in der Besitzrechte an Land und Titel von Bewohner*innen öffentlich zugänglich gemacht wurden. Nun wurde dieses Wissen von denjenigen mit mittlerem oder hohem Einkommen dazu genutzt, mit ihren ungleich verteilten Ressourcen (Geld, Wissen, Zeit, Macht) die Besitzrechte des Landes den Menschen mit wenig Vermögen zu entziehen. Beispielsweise indem Lücken in Besitzrechten gefunden wurden oder diejenigen identifiziert werden konnten, die am ehesten bereit sind, ihr Land zu verkaufen. Dadurch wurde denjenigen, die bereits wenig hatten, noch mehr genommen.

Treffen solche Verstärkungen der bestehenden Machtverhältnisse auch auf die Daten von Wikidata zu? Das ist schwer zu beurteilen. Im selben Atemzug muss auch erwähnt werden, dass Wikidata darüber hinaus Projekte ermöglicht, die eine Manifestierung von Machtstrukturen aufdecken können. So gibt es das Projekt Gender Gap, welches graphisch darstellt, wie die Verteilung von Einträgen über Frauen und Männern in Wikipedia und Wikidata ist. Das Risiko, dass Menschen Wissen ausnutzen, um sich Vorteile zu verschaffen, lässt sich nicht verhindern. Allerdings sollten wir daran arbeiten, diese Daten dafür zu nutzen, unsere Gesellschaft besser zu gestalten, indem Probleme aufgezeigt werden.

Urheber: Markus Krötzsch / https://ddll.inf.tu-dresden.de/web/Wikidata/Maps-06-2015/en / Lizens; CC0

Doch dazu müssen wir mitmachen, und das ist bereits ein Problem von Wikipedia. Dort sind nämlich die Editoren hauptsächlich männlich, weiß und gut gebildet[3]. Dieses Problem könnte durchaus auch Wikidata betreffen. Daten dazu gibt es, soweit mir bekannt, nicht. Was dadurch entsteht, wenn nur ein kleiner Teil der Bevölkerung diese Daten erzeugt, können wir an der Grafik erkennen. So sind die jeweiligen Punkte, Einträge über diesen geographischen Standort. So sind bei besonders hellen Orten, viele Daten verfügbar, zu dunkleren weniger Daten.Wie wir erkennen können, sind hauptsächlich  Daten aus Asien, den USA und Europa auf Wikidata vorhanden. Daten über Afrika gibt es im Vergleich wenige.Auch Lateinamerika sieht ziemlich dunkel aus. Doch ist das überhaupt ein Problem? Dazu schauen wir uns einmal ein konkretes Beispiel an: Landesgrenzen. Wer entscheidet denn, wo die Landesgrenzen von Israel sind? Dazu gibt es unterschiedliche Meinungen in unterschiedlichen Teilen der Welt. Wikidatas Ansatz, dieses Problem zu lösen, ist einfach. Es gibt keine eindeutige Wahrheit. Die Landesfläche kann mehrere Werte besitzen. Klingt erst mal gut, doch wenn lediglich nur ein kleiner Teil der Bevölkerung diese Einträge editiert, gibt es eben doch nur einen Wert und dieser wird als wahr empfunden, weil er durch Quellen belegbar ist.

Quellen haben allerdings unterschiedlichen Qualitäten. Für manches Wissen gibt es, nach westlichen Wissenschaftsauffassungen, keine Quellen. Beispielsweise in Kulturen, die keine Schrift haben. Bei welchen Geschichten erzählt werden, um Wissen und Erfahrungen an die nächste Generationen weiterzureichen, wie bei den Aboriginies. Wie will Wikidata deren Wissen darstellen? Mit der bisherigen technischen Umsetzung gar nicht. Dadurch besteht die Gefahr, dass Wissen verloren geht. Lediglich Quellen über die Aborigienes und nicht von den Aboriginies werden so dargestellt.

 

Maschinen und Wikidata

Haupteinsatzweck von Wikidata ist die Maschinenlesbarkeit und die dadurch automatisierte Nutzung des auf Wikidata zur Verfügung gestellten Wissens. Wikipedia kann seine Info-Box generieren. Siri kann Daten nutzen, die sie zum Beantworten von Fragen braucht. Jede*r Wissenschaftler*in kann diese Daten automatisiert nutzen. Doch werden Daten geprüft, bevor sie genutzt werden?

Siri war im Oktober 2017 in den Schlagzeilen, weil User auf Reddit herausgefunden haben, dass Siri Despacito als Nationalhymne Bulgariens angibt[4]. Doch woher kommt diese eindeutig falsche Information? Wikipedia und Google gaben die richtige Antwort. Wie Lydia Pintscher auf der WikidataCon 2017 bestätigte, lag es daran, dass Siri die Daten aus Wikidata nutzt, und dort fand sich schnell das Problem[5]. Despacito wurde dort als Nationalhymne Bulgariens von einem Vandalen angegeben. Was in unserem Fall eher lustig als alles andere ist, ist allerdings ein grundsätzliches Problem, wenn Maschinen Daten nutzen. Den Maschinen ist egal, ob diese Daten Fehler beinhalten, woher diese Daten stammen und wer sie angelegt hat. Es wird davon ausgegangen, dass diese richtig sind. Obwohl der Fehler nicht schwer zu finden war, war den meisten Nachrichtenagenturen, die darüber schrieben, nicht bewusst, wie der Fehler zustande kam.

Allerdings war der Fehler durch die starke Community schnell behoben. Wären diese Daten nicht öffentlich zugänglich, wer weiß wie lange dieser Fehler bestanden hätte. Wikidata hat durch die Erfahrung von anderen Wikimedia Projekten einen riesigen Vorteil gegenüber anderen Community basierte Wissensdatenbanken wie  Freebase. Dadurch kann Wikidata auch so ein Projekt stemmen. Wikidata hat die Expertise dieses Projekt erfolgreich aufzubauen. Und durch Projekte wie Gender Gap können Daten über Daten erzeugt werden. Das ist einer der Chancen, die das Projekt Wikidata auszeichnen.

 

 

„Daten sind eine der wichtigsten Ressourcen unserer Zeit. Sie müssen frei, offen und editierbar sein.“ Lydia Pintscher

Wikidata bringt viele Risiken mit sich. Vieles kann unserer Gesellschaft schaden, wie einseitige Wissenerzeugung. Allerdings sind sich die Menschen, die an Wikidata arbeiten, dessen durchaus bewusst. Und natürlich können wir sagen, wir gehen das Risiko nicht ein, Wikidata sollte erst einmal Lösungen für solche Herausforderungen suchen. Doch sind diese Herausforderungen und Risiken für mich kein Grund, Wikidata als generelles Risiko einzustufen. Google, Facebook, Apple usw. sammeln täglich Daten über uns alle. Unternehmen mit genug Ressourcen stehen diese Daten bereits zur Verfügung, indem sie sich aus Wikipedia generieren. Nun ermöglicht Wikidata auch uns, der breiten Bevölkerung, diese Daten zu nutzen. Es gibt genug Projekte, die diese Daten für uns praktisch nutzbar machen, wofür wir kein großes Wissen in der Informatik besitzen müssen. Sei es durch die bereits genannten Websites wie Wikipedia oder auch Wikidata Game, Quick Statements, Mix’n’Match und viele andere, wodurch wir auch die Daten editieren können. Wir können dadurch z.B Geschlechter-Diskrepanzen aufzeigen. Wir können mitmachen und die Welt um uns beeinflussen. Und das aus dem Grund, weil die Daten offen sind. Wikidata ist natürlich nicht uneingeschränkt positiv zu bewerten. Es gibt noch Herausforderungen, die gelöst werden müssen. Nicht alles davon liegt in der Verantwortung von Wikidata. Sie können diese Probleme aber durchaus bewusst aufzeigen. Wenn das der Fall ist, sehe ich sehr viel Potenzial darin, dass dieses Projekt unserer Gesellschaft positiv verändern kann. Denn was hilft mehr gegen Ungleichheit als freier Zugang zu Wissen?

 

[1] https://www.wikidata.org/wiki/Wikidata:WikiProject_Freebase
[2] http://firstmonday.org/ojs/index.php/fm/article/viewArticle/3316/2764">
[3] https://www.culik.com/1190winter2015/Paper1-Wikipedia_files/wikipedianeweditingprocess.pdf
[4] https://www.reddit.com/r/softwaregore/comments/74epbw/siri_thinks_the_national_anthem_of_bulgaria_is/
[5] https://media.ccc.de/v/wikidatacon2017-10003-wikidata_state_of_the_project#video&t=2050

https://de.wikipedia.org/wiki/Wikidata

 

back to top