JSON - Ein Datengrab?

Das JSON Datenformat erfreut sich in letzter Zeit immer größerer Beliebtheit und wird oft anstelle von XML eingesetzt. Dies liegt am deutlich besseren Verhältnis von "Nutzdaten" zu "Protokolldaten" (ein JSON ist im allg. viel kleiner als ein gleichwertiges XML).

Warum bei JSON Daten noch Vorsicht geboten ist
Der Nachteil - der oft übersehen wird - ist, daß JSON ein schemafreies Format ist. Dies wird oft sogar als eine weitere Stärke von JSON betrachtet. Es bedeutet aber, daß keine weitere Beschreibung der Daten geliefert wird, sondern diese "für sich selbst sprechen". Handelt es sich um externe Daten, so zeigt sich in der Praxis, daß sich oft allerlei "kleine Unschärfen" in die Daten schleichen, mal fehlt ein Feld, etwa weil der Datensatz in einer älteren Version eingefügt wurde, mal ist ein Feld aus Versehen anders geschrieben, mal wurden Testdaten nicht vollständig entfernt, die Liste ist lang. Können Sie sich vorstellen, solche Daten maschinell zu verarbeiten? Wie schreiben Sie ein Programm, das mit all diesen Unterschieden - die Sie im Voraus ohne vollständige Analyse der Daten gar nicht kennen können - zurecht kommt?

Aus diesen Gründen wird gerade an einer Standardisierung einer Schema Beschreibung von JSON Daten gearbeitet, welche eine Beschreibung und Validierung von JSON Daten erlaubt. Jede Verwendung von JSON ohne Schemabeschreibungen sollte derzeit genau auf ihre möglichen Folgen für die Datenqualität untersucht werden, da sonst die Gefahr besteht, daß sie "WORN" (write once, read never) und somit ein schönes Datengrab werden.