5 ★ Offene Daten

Tim Berners-Lee, der Erfinder des World Wide Webs und Initiator von Linked Data schlug ein 5-Sterne-Modell für Offene Daten (Open Data) vor. Hier geben wir Beispiele für jede Stufe und erklären die damit verbundenen Kosten und Nutzen.

5-Sterne Beispiele (Schritt für Schritt)

Beispiele …

Im Folgenden stellen wir Beispiele für jede Stufe von Tims 5-Sterne Open-Data-Modell bereit. Bei allen Beispieldaten handelt es sich um „Die Temperaturprognose für Galway, Irland für die nächsten 3 Tage”:

    • stelle deine Daten im Web unter einer offenen Lizenz bereit. Das Format ist dabei egal1
    • Beispiel …
  • ★★
    • stelle Daten in einem strukturierten Format bereit (z. B. Excel anstelle eines eingescannten Bildes einer Tabelle)2
    • Beispiel …
  • ★★★
    • verwende offene, nicht proprietäre Formate (z. B. CSV statt Excel)3
    • Beispiel …
  • ★★★★
    • verwende URIs um Dinge zu bezeichnen, damit deine Daten verlinkt werden können4
    • Beispiel …
  • ★★★★★
    • verlinke deine Daten mit anderen Daten um Kontexte herzustellen5
    • Beispiel …

Kosten & Nutzen …

Was sind die Kosten & Nutzen einer Veröffentlichung deiner Daten mit ?

Als Nutzer*In …

  • ✔ kannst du die Daten angucken.
  • ✔ kannst du die Daten ausdrucken.
  • ✔ kannst du die Daten lokal speichern (auf einer Festplatte oder auf einem USB-Stick).
  • ✔ kannst du die Daten in ein anderes Format umwandeln.
  • ✔ kannst du die Daten so verändern, wie du möchtest.
  • ✔ kannst du die Daten uneingeschränkt Teilen.

Als Herausgeber*In …

  • ✔ gestaltet sich die Veröffentlichung einfach.
  • ✔ musst du nicht wiederholt erklären, dass jede*R deine Daten verwenden darf.

„Es ist super, über das Web Zugriff auf Daten unter einer offenen Lizenz (wie PDDL, ODC-by oder CC0) zu haben. Allerdings sind diese Daten in einem Dokument verborgen und aus diesem Grund nur schwierig zu extrahieren.”

Was sind die Kosten & Nutzen einer Veröffentlichung deiner Daten mit ★★?

Als Nutzer*In kannst du all das tun, das du auch mit Daten kannst. Zusätzlich:

  • ✔ kannst du Daten direkt mit proprietärer Software bearbeiten um sie zusammenzufassen, zu visualisieren, Berechnungen durchzuführen, etc.
  • ✔ kannst du Daten in ein anderes (strukturiertes) Format exportieren.

Als Herausgeber*In …

  • ✔ gestaltet sich die Veröffentlichung nach wie vor einfach.

„Großartig! Die Daten sind jetzt im Web in einem strukturierten Format verfügbar (das maschinenlesbar ist). Allerdings sind die Daten immer noch in einem Dokument verborgen. Um auf sie zuzugreifen, wird proprietäre Software benötigt.”

Was sind die Kosten & Nutzen einer Veröffentlichung deiner Daten mit ★★★?

Als Nutzer*In kannst du all das tun, das du auch mit ★★ Daten kannst. Zusätzlich:

  • ✔ kannst du Daten ohne proprietäre Software bearbeiten.

Als Herausgeber*In …

  • ⚠ benötigst du eventuell ein Konvertierungsprogramm oder Plug-ins um die Daten aus einem proprietären Format zu exportieren.
  • ✔ gestaltet sich die Veröffentlichung nach wie vor relativ einfach.

„Ausgezeichnet! Die Daten sind nun nicht nur über das Web aufrufbar, sondern auch einfach zu nutzen. Allerdings sind die Daten nur über das Web abrufbar und nicht Teil des Webs.”

Was sind die Kosten & Nutzen einer Veröffentlichung deiner Daten mit ★★★★?

Als Nutzer*In kannst du all das tun, das du auch mit ★★★ Daten kannst. Zusätzlich:

  • ✔ kannst du von jedem Ort (im Web oder lokal) auf deine Daten verlinken.
  • ✔ kannst du ein Lesezeichen setzen.
  • ✔ kannst du nur Teile der Daten wiederverwenden.
  • ✔ kannst du gegebenenfalls bestehende Tools und Bibliotheken wiederverwenden, auch wenn diese nur einzelne Teile des Musters verstehen, welches die/der Herausger*In verwendet hat.
  • ⚠ Die Struktur der RDF-Graphen zu verstehen kann aufwendiger sein als Daten in Tabellenform (Excel/CSV) oder Baumstruktur (XML/JSON).
  • ✔ kannst du die Daten sicher mit anderen Daten kombinieren. URIs sind ein globales Schema. Wenn zwei Dinge dieselbe URI haben ist das beabsichtigt und die Daten sind damit auf dem besten Weg zu fünf Sternen!

Als Herausgeber*In …

  • ✔ hast du eine tief gehende Kontrolle über die Datenelemente und kannst ihren Zugang optimieren (load balancing, caching, etc.)
  • ✔ Andere Datenherausgeber*Innen können nun zu deinen Daten verlinken und sie damit für fünf Sterne promoten!
  • ⚠ investierst du normalerweise einige Zeit, um deine Daten vorzubereiten.
  • ⚠ musst du Datenelementen URIs zuweisen und darüber nachdenken, wie du die Daten repräsentierst.
  • ⚠ musst du entweder bereits existierende Muster finden, die du wiederverwenden kannst, oder eigene erstellen.

„Wunderbar! Jetzt sind deine Daten im Web. Die (wichtigsten) Datenelemente haben ein URI und können über das Web geteilt werden. Ein Weg Daten zu präsentieren ist RDF (Resource Description Framework), jedoch können, falls benötigt, auch andere Formate wie beispielsweise Atom konvertiert/erstellt werden.”

Was sind die Kosten & Nutzen einer Veröffentlichung deiner Daten mit ★★★★★?

Als Nutzer*In kannst du all das tun, das du auch mit ★★★★ Daten kannst. Zusätzlich:

  • ✔ kannst du während der Nutzung der Daten weitere (ähnliche) Daten entdecken.
  • ✔ kannst du direkt etwas über das Datenschema lernen.
  • ⚠ Du musst dich jetzt mit toten Links (z. B. 404-Fehler in Webseiten) befassen.
  • ⚠ Daten von einem beliebigen Link als Tatsache zu präsentieren ist so riskant, wie Personen zu erlauben, Inhalt von jeder Webseite in deiner Seite einzufügen. Achtung! Vertrauen und ein gesunder Menschenverstand sind nach wie vor notwendig.

Als Herausgeber*In …

  • ✔ machst du deine Daten auffindbar.
  • ✔ erhöhst du den Wert deiner Daten.
  • ✔ erhält deine Organisation die gleichen Vorteile von den Verlinkungen wie die Nutzer*Innen.
  • ⚠ musst du für die Verlinkung deiner Daten zu anderen Daten im Web Zeit investieren.
  • ⚠ musst du gegebenenfalls tote oder fehlerhafte Links reparieren.

„Brillant! Jetzt sind die Daten, im Web verlinkt mit anderen Daten. Sowohl Nutzer*Innen als auch Herausgeber*Innen profitieren vom Netzwerkeffekt.”

Siehe auch

Vielen Dank Andy Seaborne für den Hinweis auf den CSV-Bug, Kerstin Forsberg für den Vorschlag, ‘data highlighting’ in den Vier-/Fünfsternbeispielen zu verwenden, und Vassilios Peristeras für den Vorschlag, nicht nur das „Was”, sondern auch das „Warum” zu erklären. Dank geht an Egon Willighagen für das Bereitstellen weiterer Details zu den Vorteilen von Einstern-Daten. Weitere Beiträge von Christopher Gutteridge. Das Hintergrundbild von Tim Berners-Lee wurde von Paul Clarke aufgenommen und ist unter der Creative Commons Attribution-Share Alike 4.0 International Lizenz verfügbar. Diese Seite wurde ursprünglich von „EC FP7 Support Action LOD-Around-The-Clock” bereitgestellt (LATC), und wird jetzt unabhängig davon von James G. Kim und Michael Hausenblas betrieben.