Alle Artikel mit dem Schlagwort: pandas

Datenintensive Anwendungen designen, Datenanalyse mit Python

Geburtstag: „Datenintensive Anwendungen designen“ und „Datenanalyse mit Python“

Mit „Datenintensive Anwendungen designen“ und „Datenanalyse mit Python“ holten wir zwei Schwergewichte für Softwarearchitekten und Datenanalysten in unser Programm. Und heute feiern wir ihren Geburtstag! (Inklusive Verlosung ;)) Verraten wir mal eine schöne Routine: Einmal monatlich kommen wir alle – Lektorat, Marketing, Vertrieb, Herstellung und Geschäftsführung – in einem großen Meeting zusammen. Wir stellen einander neue Projekte vor, berichten von Konferenzen, die wir besucht haben und: wir stoßen auf unsere Geburtstagskinder an. Nicht auf die der Kollegen. Sondern auf die Jubilare aus Papier, Druckfarbe und Leim. (Ja, und natürlich auch auf ihre elektronischen Äquivalente.) Und worum ging es im Oktober? Um diese beiden: Was die Bücher auszeichnet? Das erzähle ich euch jetzt. :) Datenintensive Anwendungen designen Dieses umfassende Buch zum datenbasierten Systemdesign erschien zunächst in englischer Sprache – und wurde hochgelobt (wenn ihr beispielsweise mal zu Amazon rüber schauen möchtet).  Der Softwarearchitekt und Forscher Martin Kleppmann hat es für O’Reilly USA geschrieben, unser Übersetzer Frank Langenau hat das Manuskript wiederum ins Deutsche übertragen. Und dann? Hat sich Martin Kleppmann für uns noch einmal dran gesetzt und einige …

Pandas

Universell anwendbare Datenbeispiele – oder: Wie erkläre ich pandas?

Unser Übersetzer Dr. Kristian Rother blickt in diesem Gastbeitrag unter die Motorhaube eines didaktisch sinnvollen Buchaufbaus – am Beispiel der Python-Bibliothek pandas im Buch „Datenanalyse mit Python“. Woran erkennt man einen ausgezeichneten technischen Text? Meiner Meinung nach an der universellen Anwendbarkeit, über die eigentlich beschriebene Technologie hinaus. Beim Übersetzen des Buches “Datenanalyse mit Python” von Wes McKinney bin ich auf zahlreiche Beispiele dafür gestoßen. Im Buch wendet Wes eine bestimmte didaktische Struktur an, um universelle Anwendbarkeit zu erreichen. Da ich die gleiche didaktische Struktur selbst im Training einsetze, und außerdem Wes’ Inhalte verwende, stelle ich diese hier einmal vor. Es handelt sich dabei um die Kombination der drei Komponenten Technologie, Daten und Problemstellung. Die Technologie Logisch, dass ein technischer Text sich mit mindestens einer Technologie auseinandersetzt. In “Datenanalyse mit Python” ist das die Python-Bibliothek pandas. pandas stellt eine mächtige Datenstruktur für tabellarische Daten bereit. Ich erinnere mich an meine ersten Versuche, Tabellen in Python zu bearbeiten. Ohne pandas hatte ich die Wahl zwischen verschachtelten Listen, verschachtelten Dictionaries, Listen in Dictionaries, Dictionaries in Listen usw. Nichts davon funktionierte so richtig …