Alle Artikel mit dem Schlagwort: data scientist

Datenintensive Anwendungen designen, Datenanalyse mit Python

Geburtstag: „Datenintensive Anwendungen designen“ und „Datenanalyse mit Python“

Mit „Datenintensive Anwendungen designen“ und „Datenanalyse mit Python“ holten wir zwei Schwergewichte für Softwarearchitekten und Datenanalysten in unser Programm. Und heute feiern wir ihren Geburtstag! (Inklusive Verlosung ;)) Verraten wir mal eine schöne Routine: Einmal monatlich kommen wir alle – Lektorat, Marketing, Vertrieb, Herstellung und Geschäftsführung – in einem großen Meeting zusammen. Wir stellen einander neue Projekte vor, berichten von Konferenzen, die wir besucht haben und: wir stoßen auf unsere Geburtstagskinder an. Nicht auf die der Kollegen. Sondern auf die Jubilare aus Papier, Druckfarbe und Leim. (Ja, und natürlich auch auf ihre elektronischen Äquivalente.) Und worum ging es im Oktober? Um diese beiden: Was die Bücher auszeichnet? Das erzähle ich euch jetzt. :) Datenintensive Anwendungen designen Dieses umfassende Buch zum datenbasierten Systemdesign erschien zunächst in englischer Sprache – und wurde hochgelobt (wenn ihr beispielsweise mal zu Amazon rüber schauen möchtet).  Der Softwarearchitekt und Forscher Martin Kleppmann hat es für O’Reilly USA geschrieben, unser Übersetzer Frank Langenau hat das Manuskript wiederum ins Deutsche übertragen. Und dann? Hat sich Martin Kleppmann für uns noch einmal dran gesetzt und einige …

Data, Data, Data: Berlin Buzzwords 2016

Die Berlin Buzzwords begleiten wir inzwischen schon seit der ersten Ausgabe im Jahr 2010. Nun steht – wie immer Anfang Juni – schon die siebte Ausgabe der (Big-)Data-Konferenz vor der Tür, auf die wir Euch gerne wieder hinweisen möchten. (Und Tickets verlosen.) Die Keynotes Als Keynotespeaker erwarten Euch in diesem Jahr  Diane Mueller-Klingspor und Neha Narkhede: Diane Mueller-Klingspor ist eine langjährige „Pythonista“ und Open Source-Verfechterin. Momentan arbeitet sie als Community Lead bei Red Hat an der Application-Platform OpenShift Origin. Diane engagiert sich zudem in der Maker-Community und ist Gründerin von GetMakered Labs, einer mobilen Makerspace-Kollaboration, die Kinder aller Altersstufen inspirieren und ermutigen soll, sich mit neuen Technologien auseinanderzusetzen. Ihre Keynote findet am 6. Juni statt und trägt den Titel: „Inspiring the Next Generation to Run Away and Join Our Software Circus“. Neha Narkhede ist Mitgründerin und CTO von Confluent. Zuvor war sie für die Petabyte Scale Streaming Infrastruktur von LinkedIn zuständig, die mehrere Millionen Datenvorgänge unterstützt. Zudem ist sie eine der EntwicklerInnen von Apache Kafka, PMC Mitglied und Projekt-Comitterin. Neha startet Tag 2 der Buzzwords unter dem Titel: „Application development …

Der Jahrgang 2016 – Teil 3

Wie versprochen gibt es neuen Lesestoff. Heute etwas für alle, die sich gerne durch riesige Datenberge ackern möchten: Einführung in Data Science „Der beste Weg, hacken zu lernen, ist, Dinge zu hacken“, schreibt der Google-Entwickler Joel Grus im Vorwort seines aktuellen Buchs Einführung in Data Science. Darin führt er Euch mit Hilfe von Python in die Welt der Datenanalyse ein – und das erklärtermaßen nicht nur mit Praxisbezug, sondern auch mit der Lust am Spiel mit dem Grundstoff Daten. Voraussetzungen Alles, was Ihr braucht, sind erste Programmierkenntnisse, wobei das Buch auch mit einer kleinen Python-Einführung startet. Und: Eure Kenntnisse aus Stochastik, Statistik und linearer Algebra sollten nicht ganz verschüttet sein. In Bezug auf Data Science selbst fängt Joel Grus bewusst ganz von vorne an, Ihr müsst keinerlei Techniken oder Tools vorab kennen. Diese führt der Autor erst im Laufe des Buches nach und nach ein, und zwar erst dann, wenn Ihr die Grundlagen verstanden habt. Alle Codebeispiele liegen übrigens auf GitHub, sowohl für Python 2.7 als auch für Python 3.x. Und warum sollte man sich durch Mathematik und Python-Code …

Ärmel hoch und rein in die Daten: Die Big Data Week in Berlin

Was ist Big Data, und welche Effekte ergeben sich für unser Leben? Anlässlich der nächste Woche unter anderem in Berlin stattfindenden Big Data Week sprach ich mit Data Scientist Klaas Bollhöfer. Klaas, Anfang Mai ist Berlin das Epizentrum aller digital arbeitenden Menschen: Neben re:publica und Linuxtag ist die Hauptstadt auch wieder eine von dreißig Locations weltweit, die sich an der Big Data Week beteiligen. Erzähl doch mal, was sich dahinter verbirgt. Die Big Data Week ist eine 2012 ins Leben gerufene Initiative mit dem Ziel, die Big Data Communities der Welt für eine Woche intensiv miteinander zu vernetzen, Hunderte von Events, Meetups, Konferenzen & Hackathons unter einem gemeinsamen Dach zu verorten und gemeinsam als zentrales Organ einer international agierenden Interessensgemeinschaft zu agieren. Die Big Data Week wird von London aus organisiert und umspannt alle Kontinente (mit Ausnahme Antarktis, zumindest noch :-)), mehr als 30 Städte und mehr als 200 Veranstaltungen. Es ist ein „Global Festival of Data“, das in diesem Jahr bereits zum 2. Mal auch in Berlin stattfindet – vom 5. bis 11. Mai. Wie …

Aus dem Leben eines Datenforschers

Ein Gastbeitrag von Klaas Bollhoefer. Ich bin Data Scientist. Ein Datenforscher. Jemand, der Probebohrungen im wieder entdeckten Rohstoff Daten vornimmt. Und damit Mitglied dieser sagenumwobenen Gruppe von Experten, über die im Umfeld von Big Data aktuell so viele reden. Hilary Mason, Chief Data Scientist bei bit.ly und Popstar dieser neuen Disziplin, hat Data Science einmal als Schnittstellenkompetenz beschrieben. Data Science liegt da, wo Computerwissenschaften, Statistik und Mathematik, Ingenieurskunst und „Hacking“ (hier: der neugierige, kreative Umgang mit Computern), Design und Algorithmen zusammentreffen. Data Science ist ein multidisziplinärer Raum, in dem neue Ideen und Lösungen entstehen. Hilary Mason nennt die Menschen, die diesen Raum bewohnen, „awesome nerds“ (zu Deutsch: fantastische Computerfreaks) oder, businesstauglicher: „Data Scientists“. Diese Definition erscheint mir nicht vollständig, fehlt ihr doch der entscheidende Produkt- bzw. Geschäftsbezug. Neben dem „Was“ (was für Daten habe ich?) und dem „Wie“ (wie kreiere ich neues Wissen aus diesen Daten mit all den Big-Data- Technologien und künstlichen Intelligenzen?) ist noch eine andere Frage auschlaggebend, nämlich die nach dem Sinn und Zweck des Unterfangens. Welches Problem möchte ich lösen? Welche Potenziale …