Alle Artikel mit dem Schlagwort: Datenanalyse

Datenintensive Anwendungen designen, Datenanalyse mit Python

Geburtstag: „Datenintensive Anwendungen designen“ und „Datenanalyse mit Python“

Mit „Datenintensive Anwendungen designen“ und „Datenanalyse mit Python“ holten wir zwei Schwergewichte für Softwarearchitekten und Datenanalysten in unser Programm. Und heute feiern wir ihren Geburtstag! (Inklusive Verlosung ;)) Verraten wir mal eine schöne Routine: Einmal monatlich kommen wir alle – Lektorat, Marketing, Vertrieb, Herstellung und Geschäftsführung – in einem großen Meeting zusammen. Wir stellen einander neue Projekte vor, berichten von Konferenzen, die wir besucht haben und: wir stoßen auf unsere Geburtstagskinder an. Nicht auf die der Kollegen. Sondern auf die Jubilare aus Papier, Druckfarbe und Leim. (Ja, und natürlich auch auf ihre elektronischen Äquivalente.) Und worum ging es im Oktober? Um diese beiden: Was die Bücher auszeichnet? Das erzähle ich euch jetzt. :) Datenintensive Anwendungen designen Dieses umfassende Buch zum datenbasierten Systemdesign erschien zunächst in englischer Sprache – und wurde hochgelobt (wenn ihr beispielsweise mal zu Amazon rüber schauen möchtet).  Der Softwarearchitekt und Forscher Martin Kleppmann hat es für O’Reilly USA geschrieben, unser Übersetzer Frank Langenau hat das Manuskript wiederum ins Deutsche übertragen. Und dann? Hat sich Martin Kleppmann für uns noch einmal dran gesetzt und einige …

R für Data Science

E-Book-Deal: R für Data Science

Gesammelte Daten in Erkenntnisse verwandeln: Das ist das Ziel jedes Forschers und Wissenschaftlers, jedes Entwicklers, jedes Produktmanagers und Werbers und wohl jedes Unternehmers. Was ließe sich erreichen, wenn man aus dem Wust an Einzelinformationen über ein Produkt oder über einen Kunden, über Prozesse oder über Geschehnisse, über Eindrücke und Gedanken ein klares Bild ableiten könnte? Moderne Data Science will genau das. Und mit der Datenbanksprache R gibt es ein Tool, das Antworten liefern kann. Hadley Wickham – Chief Scientist bei RStudio und Mitglied der R Foundation – und sein Co-Autor Garrett Grolemund – Statistiker, Lehrer und Master Instructor bei RStudio – führen in ihrem Buch „R für Data Science“ Studenten, Data Scientists und Datenanalysten durch den vollständigen Data-Science-Zyklus aus Datenimport, Bereinigung, Transformation, der Visualisierung und Modellierung sowie schließlich der Kommunikation der Ergebnisse mit R Markdown. Das Buch gibt die notwendigen Tools an die Hand, erklärt und ordnet ein. Und zwar nicht nach einer streng akademischen Reihenfolge, sondern immer genau dann, wenn eine Aufgabe in der Praxis ansteht. Es eignet sich auch für Programmieranfänger. Nur im Juni gibt’s das E-Book …

Statistik mit R

Neuerscheinung: Statistik mit R

„Dieses Buch ist nicht einfach ein Buch über R. Auch nicht über Statistik. Es ist ein Buch über Statistik mit R“, leitet der Volkswirt, Projektmanager und Autor Joachim Zuckarelli sein Buch ein.  Denn Zuckarelli will eines: Anwendungsorientierung. Statistische Konzepte erklären und sofort in R umsetzen. Ergebnisse interpretieren. Systematisch in die Statistik einführen. Aber: keine Methoden diskutieren. Keine theoretischen Erörterungen der Sprachkonzepte von R. An der Stelle unterscheidet sich das Buch deutlich von reinen Statistik- bzw. R-Handbüchern sowie -Tutorials oder Online-Foren. Zuckarelli bleibt nah an der Praxis – geht zum Beispiel auf die häufigsten Fehlermeldungen ein – und verfolgt dabei einen didaktisch sinnvollen Lehrplan.  Wer sollte es lesen? Alle, die R zügig für ihre Arbeit einsetzen wollen. Dabei spielt es keine Rolle, ob damit wissenschaftliche Arbeiten angefertigt oder Marktforschungsdaten aufbereitet werden sollen. Ob Ihr für Euer Startup den Finanzmarkt analysieren oder endlich die Dissertation fertigstellen wollt. Wann immer Ihr empirisch arbeiten wollt (oder müsst) und R einsetzen wollt: Dieses Buch liefert Euch eine pragmatische und praxisorientierte Einführung. Zuckarelli schreibt sehr verständlich und versetzt Euch in die Lage, sehr schnell produktiv …

Handbücher zu Windows Server und Excel

Excel, Windows Server und Gartenpartys im Herbst

„Viele meinen ja, sie können Excel, nur weil sie die Adressen ihrer Mitarbeiter mal in ein Spreadsheet getippt haben“, meinte der Bekannte auf der Gartenparty am vergangenen Wochenende. (Ja, Gartenparty. Geht alles im Oktober.) Besagter Bekannter jedenfalls habe es satt, in Bewerbungsunterlagen einfach per default „MS Office-Kenntnisse: sehr gut“ zu lesen, betonte er weiter. „Und dann scheitert es schon an der Summenfunktion, von mehr brauchen wir gar nicht reden“, erklärte er weiter.  Microsoft Excel 2016: Das Handbuch Na – welches Buch ich ihm empfohlen habe, ist klar, oder? In diesem Jahr nämlich neu erschienen ist unser knapp 1.000 Seiten starkes Handbuch Microsoft Excel 2016.  Das Autorenteam Frank Arendt-Theilen, Dietmar Gieringer, Hildegard Hügemann, Dominik Petri und Eckehard Pfeifer hat es nicht nur gründlich aktualisiert, sondern auch zu den neuen Business-Intelligence-Tools erweitert. Mein Bekannter wird es nun für seine Firma kaufen. Neben meiner Buchempfehlung konnte ich mir übrigens eine kleine Predigt darüber, dass gute Chefs sich durchaus aktiv für die Weiterbildung ihrer Mitarbeiter engagieren können, nicht ganz verkneifen. ;-) Überzeugend an Büchern fand er nun, dass man sie immer …

Pandas

Universell anwendbare Datenbeispiele – oder: Wie erkläre ich pandas?

Unser Übersetzer Dr. Kristian Rother blickt in diesem Gastbeitrag unter die Motorhaube eines didaktisch sinnvollen Buchaufbaus – am Beispiel der Python-Bibliothek pandas im Buch „Datenanalyse mit Python“. Woran erkennt man einen ausgezeichneten technischen Text? Meiner Meinung nach an der universellen Anwendbarkeit, über die eigentlich beschriebene Technologie hinaus. Beim Übersetzen des Buches “Datenanalyse mit Python” von Wes McKinney bin ich auf zahlreiche Beispiele dafür gestoßen. Im Buch wendet Wes eine bestimmte didaktische Struktur an, um universelle Anwendbarkeit zu erreichen. Da ich die gleiche didaktische Struktur selbst im Training einsetze, und außerdem Wes’ Inhalte verwende, stelle ich diese hier einmal vor. Es handelt sich dabei um die Kombination der drei Komponenten Technologie, Daten und Problemstellung. Die Technologie Logisch, dass ein technischer Text sich mit mindestens einer Technologie auseinandersetzt. In “Datenanalyse mit Python” ist das die Python-Bibliothek pandas. pandas stellt eine mächtige Datenstruktur für tabellarische Daten bereit. Ich erinnere mich an meine ersten Versuche, Tabellen in Python zu bearbeiten. Ohne pandas hatte ich die Wahl zwischen verschachtelten Listen, verschachtelten Dictionaries, Listen in Dictionaries, Dictionaries in Listen usw. Nichts davon funktionierte so richtig …