Alle Artikel mit dem Schlagwort: JSON

Moderne Werkzeuge für die rechnergestützte Statistik, Teil 2

Statistische Datenauswertung lebt vom Zusammenspiel zahlreicher Kompetenzen, Werkzeuge und Hilfsmittel. In Teil 1 dieses Artikels habe ich skizziert, welchen Anforderungen sich eine Statistiksoftware aus meiner Sicht heute stellen muss. In Teil 2 nun stelle ich verschiedene textbasierte Formate vor, die als Datenquellen eine relevante Rolle spielen. Textbasierte Datenformate & Auszeichnungssprachen Daten müssen vor der Analyse in der Regel auf irgendeine Weise aufbereitet, umgeformt und in geeignete(re) Speicherformate überführt werden. Speicherformate spielen auch in den Ausnahmefällen eine Rolle, in denen der Analyst bereits auf die elektronische Erfassung Einfluss nehmen kann. Jeder Arbeitsschritt, der in Handarbeit erledigt werden muss, zieht typische und nur begrenzt kontrollierbare Probleme nach sich (die u.a. mit der Vigilanz, mit Figur-Grund-Problemen und mit sensomotorischen Fehlleistungen zusammenhängen). Bei solchen Aufgaben können wir uns heute allerdings von einer Vielzahl leistungsfähiger und oft kostengünstiger Werkzeuge und Technologien unterstützen lassen. Sobald Daten ins Spiel kommen, arbeite ich nach zwei einfachen Prinzipien: (1) Handarbeit im Umgang mit Daten ist auf ein absolutes Minimum zu reduzieren; (2) maschinelle Verarbeitung der Daten muss so früh einsetzen, wie es das jeweilige Szenario zulässt, und …

CouchDB – ein neuer Datenbankansatz

Manchmal geschehen Dinge rund um die IT, die ich nicht verstehe. Rümpfe ich gelegentlich die Nase über Entwicklungen, die wahrlich nicht mehr taufrisch sind, aber dennoch als technische Revolution gefeiert werden, so schüttel’ ich auch mal den Kopf, wenn wirklich neue und hoch interessante IT-Entwicklungen kaum Gehör bekommen. CouchDB ist so ein Fall. CouchDB ist Vertreter eines neuen Datenbanktyps, und zwar einer so genannten dokumentenbasierten Datenbank. CouchDB speichert Daten nicht in Tabellen, Zeilen und Spalten, sondern verwaltet sie in Dokumenten. Anders als bei relationalen Datenbanksystemen werden Abfragen nicht über die Datenbankabfragesprache SQL definiert, sondern über HTTP-Befehle entsprechend den Prinzipien des REST-Paradigmas: Speicheroperationen über HTTP PUT beziehungsweise POST und Leseoperationen über HTTP GET. Angefragte Daten werden im JSON-Format ausgegeben, das gerade bei Webprogrammierern bekannt und geschätzt ist. Gespeicherten Daten müssen nicht einer vorab erstellten Definition genügen, dem so genannten Schema, weshalb CouchDB auch als schemalose Datenbank bezeichnet wird. Im Mittelpunkt steht stets die Struktur der gespeicherten Dokumente. CouchDB ist dabei nicht als Ersatz für relationale Datenbanken zu betrachten. Jeder Ansatz hat unterschiedliche Stärken und Schwächen. Wenn …