Interview mit Julien Raemy: Open Data erkunden und vermitteln

Hinter offenen Daten stecken Geschichten, Ideen und vor allem passionierte Menschen, die der breiten Öffentlichkeit Wissen zugänglich machen möchten. Julien Raemy, engagierter Dozent und Open-Data-Spezialist, verkörpert diese Philosophie perfekt.

Für ihn ist klar, dass Wissen nicht nur im Hörsaal vermittelt werden sollte, weshalb er seinen Kurs Introduction to Open Data für alle geöffnet hat. Dieser ebenso grosszügige wie visionäre Schritt zeugt von seinem Einsatz für geteilte, frei zugängliche und lebendige Informationen.

Im Interview erzählt er, wie offene Daten unsere Beziehung zu Informationen verändern können, da sie sowohl die Technologie als auch die Ethik und Zusammenarbeit aufwerten. Julien Raemy eröffnet uns dabei eine Welt, in der Daten zu einem echten Innovationsmotor werden, auf den alle zugreifen können.

Was hat Sie dazu inspiriert, Open Data zu unterrichten?

«Ich habe an der Haute école de gestion in Genf Informationswissenschaften studiert und dort nach meinem Abschluss als Assistent gearbeitet. Diese Institution bildet die meisten Informationsfachleute in der Westschweiz aus und ich stehe ihr noch heute nahe. Mein Interesse an der Erschliessung von Kulturerbedaten führte schliesslich dazu, dass ich während meines Doktorats an der Universität Basel den Kurs Introduction to Open Data übernehmen durfte, den ich im Frühlingssemester 2024 erstmals gehalten habe.»

Gibt es Persönlichkeiten, die Sie im Bereich offene Daten besonders inspirieren?

«Absolut. Ich denke da an Robert Merton, einen amerikanischen Soziologen, der bereits in den 1940er-Jahren die Idee formulierte, dass die Wissenschaft dem Gemeinwohl dienen und allen zugänglich sein sollte. Der Programmierer und Aktivist Aaron Swartz verkörperte diese Vision, indem er für den freien Austausch von Wissen kämpfte, insbesondere durch den offenen Zugang zu wissenschaftlichen Veröffentlichungen. Susan Leigh Star, eine Pionierin der Erforschung unsichtbarer Infrastrukturen, hat mich mit ihrer Arbeit über Klassifikationssysteme und Wissensaustausch stark beeinflusst. Und natürlich Tim Berners-Lee, der Erfinder des World Wide Web, der den Grundstein für Linked Data gelegt hat – eine echte Revolution für die Art und Weise, wie Daten verknüpft und verbreitet werden.»

«Ich möchte sie dazu befähigen, in ihren zukünftigen Institutionen zu Agenten des Wandels zu werden und eine Kultur der Offenheit und des Datenaustauschs zu fördern.»

Können Sie uns erklären, was Ihr Kurs «Introduction to Open Data» genau umfasst?

«Der Kurs richtet sich an Studierende der Informationswissenschaften und verbindet Theorie und Praxis. Die Teilnehmenden erkunden die historischen, ethischen und technischen Dimensionen von Open Data, lernen aber vor allem auch, mit Datensätzen korrekt umzugehen – unabhängig davon, ob diese aus institutionellen Archiven oder Plattformen wie opendata.swiss stammen. Ich möchte sie dazu befähigen, in ihren zukünftigen Institutionen zu Agenten des Wandels zu werden und eine Kultur der Offenheit und des Datenaustauschs zu fördern.

Um den Kurs lebendig zu gestalten, verwende ich konkrete Beispiele wie offene und standardisierte API, etwa die Spezifikationen aus den Communities International Image Interoperability Framework (IIIF) und Linked Art, die die Diffusion von digitalen Kulturerbedaten und Metadaten revolutionieren. Diese Standards veranschaulichen, wie offene Daten den Zugang zu und die Wiederverwendung von kulturellen Sammlungen verändern können. Sie ermutigen die Studierenden, entsprechende Praktiken in ihrem zukünftigen beruflichen Umfeld einzubeziehen und umzusetzen.»

Welche Schlüsselkompetenzen wollen Sie vermitteln?

«Ich möchte, dass die Studierenden zu Expertinnen und Experten im Erkennen von Best Practices in Bezug auf Metadaten, Formate und Lizenzen werden und vor allem die Fähigkeit zur kritischen Analyse entwickeln. Sie müssen in der Lage sein, die Qualität und Wiederverwendbarkeit von Daten einzuschätzen, die Prinzipien FAIR (Findable, Accessible, Interoperable, Reusable), CARE (Collective Benefit, Authority to Control, Responsibility, Ethics) und Collections as Data zu verstehen sowie praktische Tools wie OpenRefine zur Datenbereinigung zu beherrschen.»

«Es stimmt, dass das Offenlegen und Strukturieren von Daten zunächst nach viel Arbeit aussieht, aber in Wirklichkeit ist es eine strategische Investition, die sich langfristig lohnt.»

Sie haben beschlossen, Ihre Unterlagen online für alle zugänglich zu machen. Weshalb?

«Ich war immer überzeugt, dass ein Kurs über Open Data selbst zugänglich sein muss. Ich teile bereits viele meiner Konferenzen und Workshops und es erscheint mir paradox, diesen Kurs unter Verschluss zu halten. Damit setze ich die im Unterricht vermittelten Werte in Bezug auf Offenheit direkt um.»

Was sind Ihrer Meinung nach die wichtigsten jüngsten Entwicklungen im Bereich Open Data?

Der Einsatz von Schichten auf Basis von maschinellem Lernen eröffnet vielversprechende Möglichkeiten für eine einfachere Datenabfrage. Ich würde dennoch dringend empfehlen, den Fokus auf Linked Open Data (LOD) basierend auf RDF (Resource Description Framework) zu legen. Nur mit kontrollierten Ontologien und Vokabularen lässt sich Wissen effizient verwalten und strukturieren. Ein Roboter kann aus solchen Daten wesentlich besser logische Schlüsse ziehen als aus herkömmlichen CSV-Dateien, selbst wenn diese sauber strukturiert sind.

«Wir müssen aus der Logik des A4-Dokuments ausbrechen. Gesammelte Daten sollten nicht in einem starren, isolierten Papierformat verbleiben. Daten sind heute keine statischen Dokumente mehr, sondern dynamische und vernetzte Ressourcen.»

Sehen Sie bezüglich der Nutzung von Open Data Unterschiede zwischen dem akademischen Bereich und dem öffentlichen oder privaten Sektor?

«Ja, die Beweggründe und die Terminologie unterscheiden sich ein wenig. Im akademischen Bereich spricht man eher von Open Research Data (ORD) und Prinzipien wie FAIR und CARE sind wichtiger als strenge rechtliche Rahmenbedingungen. Die Universitäten veröffentlichen schon länger offene Daten, aber personelle oder finanzielle Veränderungen können dazu führen, dass sich die Praxis schnell verändert – sowohl positiv als auch negativ.

Open Government Data (OGD) des öffentlichen Sektors geniessen mehr Kontinuität, weil sie mit dauerhaften öffentlichen Politiken zusammenhängen. Aus technischer Sicht ist die Praxis (Metadaten, Formate, Lizenzen) in den beiden Sektoren häufig ähnlich. Ich beobachte vor allem, dass sie sich ergänzen: ORD können sich auf OGD stützen, während OGD umgekehrt akademische Prinzipien einbeziehen können.

Im Privatsektor werden nach wie vor wenige offene Daten veröffentlicht, wobei die Transparenz tendenziell zunimmt.»

«Ich würde den Schwerpunkt auf die Entwicklung und systematische Anwendung von Persistent Identifiers (PID) legen. So lassen sich mithilfe von Codebeispielen und Tutorials Ressourcen erstellen, die besser zugänglich sind und den Nutzenden das Generieren von Visualisierungen und die Integration von Daten erleichtern.»

Haben Sie einen letzten Ratschlag für diejenigen, die Open Data in ihre Arbeit oder ihren Unterricht integrieren möchten?

Das Wichtigste: Quellen immer korrekt zitieren! Nur weil die Daten offen sind, heisst das nicht, dass sie ohne Anerkennung übernommen werden sollen. Ein ethischer, kritischer und überlegter Ansatz, der Transparenz und Wiederverwendbarkeit in den Vordergrund stellt, ist deshalb grundlegend.»

Und wie würden Sie die öffentliche Verwaltung ermutigen, ihre Daten vermehrt zu öffnen?

«Es stimmt, dass das Offenlegen und Strukturieren von Daten zunächst nach viel Arbeit aussieht, aber in Wirklichkeit ist es eine strategische Investition, die sich langfristig lohnt. Wir müssen aus der Logik des A4-Dokuments ausbrechen. Gesammelte Daten sollten nicht in einem starren, isolierten Papierformat verbleiben. Daten sind heute keine statischen Dokumente mehr, sondern dynamische und vernetzte Ressourcen.

Indem wir sie zugänglich machen, ebnen wir den Weg für unerwartete Innovationen, interdisziplinäre Zusammenarbeit und Synergien, die weit über den ursprünglichen Rahmen der Datenerhebung hinausgehen. Die wichtigste Herausforderung besteht darin, ihre möglichst breite Wiederverwendbarkeit sicherzustellen.»

Was empfehlen Sie Lesenden, die mehr wissen möchten?

«Ich würde sagen, beginnen Sie mit Showcases, um das volle Potenzial von Open Data zu begreifen. Das Projekt 12 Sunsets von Getty ist ein grossartiges Beispiel für API und offene Daten zu einem Fotokorpus. Auf der Website meines Kurses habe ich zudem eine Liste von inspirierenden Anwendungsfällen zusammengestellt, die zeigen, wie Daten zu visuellen Geschichten werden können.»

«Der Titel meiner Autobiografie? ‹Open Data Beer: Meine Einsichten zwischen Fassbier und Datensatz›.»

Haben Sie neue Open-Data-Projekte in Sicht?

«Ja, ich arbeite mit dem Schweizerischen Bundesarchiv am Projekt LINDASnext, der Fortsetzung von LINDAS. Es soll den öffentlichen Verwaltungen ermöglichen, ihre Daten in Form von Wissensgraphen zu veröffentlichen. Dadurch sollen Verwaltungsdaten stärker vernetzt und zugänglich gemacht werden.»

Wenn Sie einen Aspekt des Ökosystems Open Data verbessern könnten, welcher wäre das?

«Ich würde den Schwerpunkt auf die Entwicklung und systematische Anwendung von Persistent Identifiers (PID) legen. So lassen sich mithilfe von Codebeispielen und Tutorials Ressourcen erstellen, die besser zugänglich sind und den Nutzenden das Generieren von Visualisierungen und die Integration von Daten erleichtern. Idealerweise würde ich dafür sorgen, dass standardmässig mit LOD gearbeitet wird, um die Vernetzung und das Verständnis der Datensätze zu verbessern.»

Zum Schluss noch ein paar kurze und spielerische Fragen...

Wenn OGD ein traditionelles Gericht wären, welches wäre es? «Ein Fondue, weil es ein geselliges Gericht ist, bei dem ganz unterschiedliche Zutaten zu etwas Einzigartigem verschmelzen.»
Wenn OGD Superhelden wären, welche Superkraft hätten sie? «Ich würde sagen, sie wären ‹Interoperability Woman›, die in der Lage ist, unterschiedliche Systeme miteinander kommunizieren zu lassen und kompatibel zu machen.»
Was war Ihre überraschendste Entdeckung bei den Verwaltungsdaten? «Ich liebe die App, die die Anzahl der vorhandenen Briefkästen erfasst: ‹Wie viele Briefkästen gibt es?› Eine einfache Frage, die jedoch den enormen Reichtum offener Daten aufzeigt.»
Wie würde der Titel Ihrer Autobiografie über Ihre Abenteuer in der Welt der OGD lauten? «Open Data Beer: Meine Einsichten zwischen Fassbier und Datensatz.»