Alle Artikel mit dem Schlagwort: Datenanalyse

R für Data Science

E-Book-Deal: R für Data Science

Gesammelte Daten in Erkenntnisse verwandeln: Das ist das Ziel jedes Forschers und Wissenschaftlers, jedes Entwicklers, jedes Produktmanagers und Werbers und wohl jedes Unternehmers. Was ließe sich erreichen, wenn man aus dem Wust an Einzelinformationen über ein Produkt oder über einen Kunden, über Prozesse oder über Geschehnisse, über Eindrücke und Gedanken ein klares Bild ableiten könnte? Moderne Data Science will genau das. Und mit der Datenbanksprache R gibt es ein Tool, das Antworten liefern kann. Hadley Wickham – Chief Scientist bei RStudio und Mitglied der R Foundation – und sein Co-Autor Garrett Grolemund – Statistiker, Lehrer und Master Instructor bei RStudio – führen in ihrem Buch „R für Data Science“ Studenten, Data Scientists und Datenanalysten durch den vollständigen Data-Science-Zyklus aus Datenimport, Bereinigung, Transformation, der Visualisierung und Modellierung sowie schließlich der Kommunikation der Ergebnisse mit R Markdown. Das Buch gibt die notwendigen Tools an die Hand, erklärt und ordnet ein. Und zwar nicht nach einer streng akademischen Reihenfolge, sondern immer genau dann, wenn eine Aufgabe in der Praxis ansteht. Es eignet sich auch für Programmieranfänger. Nur im Juni gibt’s das E-Book …

Statistik mit R

Neuerscheinung: Statistik mit R

„Dieses Buch ist nicht einfach ein Buch über R. Auch nicht über Statistik. Es ist ein Buch über Statistik mit R“, leitet der Volkswirt, Projektmanager und Autor Joachim Zuckarelli sein Buch ein.  Denn Zuckarelli will eines: Anwendungsorientierung. Statistische Konzepte erklären und sofort in R umsetzen. Ergebnisse interpretieren. Systematisch in die Statistik einführen. Aber: keine Methoden diskutieren. Keine theoretischen Erörterungen der Sprachkonzepte von R. An der Stelle unterscheidet sich das Buch deutlich von reinen Statistik- bzw. R-Handbüchern sowie -Tutorials oder Online-Foren. Zuckarelli bleibt nah an der Praxis – geht zum Beispiel auf die häufigsten Fehlermeldungen ein – und verfolgt dabei einen didaktisch sinnvollen Lehrplan.  Wer sollte es lesen? Alle, die R zügig für ihre Arbeit einsetzen wollen. Dabei spielt es keine Rolle, ob damit wissenschaftliche Arbeiten angefertigt oder Marktforschungsdaten aufbereitet werden sollen. Ob Ihr für Euer Startup den Finanzmarkt analysieren oder endlich die Dissertation fertigstellen wollt. Wann immer Ihr empirisch arbeiten wollt (oder müsst) und R einsetzen wollt: Dieses Buch liefert Euch eine pragmatische und praxisorientierte Einführung. Zuckarelli schreibt sehr verständlich und versetzt Euch in die Lage, sehr schnell produktiv …

Handbücher zu Windows Server und Excel

Excel, Windows Server und Gartenpartys im Herbst

„Viele meinen ja, sie können Excel, nur weil sie die Adressen ihrer Mitarbeiter mal in ein Spreadsheet getippt haben“, meinte der Bekannte auf der Gartenparty am vergangenen Wochenende. (Ja, Gartenparty. Geht alles im Oktober.) Besagter Bekannter jedenfalls habe es satt, in Bewerbungsunterlagen einfach per default „MS Office-Kenntnisse: sehr gut“ zu lesen, betonte er weiter. „Und dann scheitert es schon an der Summenfunktion, von mehr brauchen wir gar nicht reden“, erklärte er weiter.  Microsoft Excel 2016: Das Handbuch Na – welches Buch ich ihm empfohlen habe, ist klar, oder? In diesem Jahr nämlich neu erschienen ist unser knapp 1.000 Seiten starkes Handbuch Microsoft Excel 2016.  Das Autorenteam Frank Arendt-Theilen, Dietmar Gieringer, Hildegard Hügemann, Dominik Petri und Eckehard Pfeifer hat es nicht nur gründlich aktualisiert, sondern auch zu den neuen Business-Intelligence-Tools erweitert. Mein Bekannter wird es nun für seine Firma kaufen. Neben meiner Buchempfehlung konnte ich mir übrigens eine kleine Predigt darüber, dass gute Chefs sich durchaus aktiv für die Weiterbildung ihrer Mitarbeiter engagieren können, nicht ganz verkneifen. ;-) Überzeugend an Büchern fand er nun, dass man sie immer …

Pandas

Universell anwendbare Datenbeispiele – oder: Wie erkläre ich pandas?

Unser Übersetzer Dr. Kristian Rother blickt in diesem Gastbeitrag unter die Motorhaube eines didaktisch sinnvollen Buchaufbaus – am Beispiel der Python-Bibliothek pandas im Buch „Datenanalyse mit Python“. Woran erkennt man einen ausgezeichneten technischen Text? Meiner Meinung nach an der universellen Anwendbarkeit, über die eigentlich beschriebene Technologie hinaus. Beim Übersetzen des Buches “Datenanalyse mit Python” von Wes McKinney bin ich auf zahlreiche Beispiele dafür gestoßen. Im Buch wendet Wes eine bestimmte didaktische Struktur an, um universelle Anwendbarkeit zu erreichen. Da ich die gleiche didaktische Struktur selbst im Training einsetze, und außerdem Wes’ Inhalte verwende, stelle ich diese hier einmal vor. Es handelt sich dabei um die Kombination der drei Komponenten Technologie, Daten und Problemstellung. Die Technologie Logisch, dass ein technischer Text sich mit mindestens einer Technologie auseinandersetzt. In “Datenanalyse mit Python” ist das die Python-Bibliothek pandas. pandas stellt eine mächtige Datenstruktur für tabellarische Daten bereit. Ich erinnere mich an meine ersten Versuche, Tabellen in Python zu bearbeiten. Ohne pandas hatte ich die Wahl zwischen verschachtelten Listen, verschachtelten Dictionaries, Listen in Dictionaries, Dictionaries in Listen usw. Nichts davon funktionierte so richtig …

Ärmel hoch und rein in die Daten: Die Big Data Week in Berlin

Was ist Big Data, und welche Effekte ergeben sich für unser Leben? Anlässlich der nächste Woche unter anderem in Berlin stattfindenden Big Data Week sprach ich mit Data Scientist Klaas Bollhöfer. Klaas, Anfang Mai ist Berlin das Epizentrum aller digital arbeitenden Menschen: Neben re:publica und Linuxtag ist die Hauptstadt auch wieder eine von dreißig Locations weltweit, die sich an der Big Data Week beteiligen. Erzähl doch mal, was sich dahinter verbirgt. Die Big Data Week ist eine 2012 ins Leben gerufene Initiative mit dem Ziel, die Big Data Communities der Welt für eine Woche intensiv miteinander zu vernetzen, Hunderte von Events, Meetups, Konferenzen & Hackathons unter einem gemeinsamen Dach zu verorten und gemeinsam als zentrales Organ einer international agierenden Interessensgemeinschaft zu agieren. Die Big Data Week wird von London aus organisiert und umspannt alle Kontinente (mit Ausnahme Antarktis, zumindest noch :-)), mehr als 30 Städte und mehr als 200 Veranstaltungen. Es ist ein „Global Festival of Data“, das in diesem Jahr bereits zum 2. Mal auch in Berlin stattfindet – vom 5. bis 11. Mai. Wie …