Alle Artikel mit dem Schlagwort: Datenbanken

Vorgestellt: Die NoSQL-Usergroup in Köln

Usergroups bieten den direkten, persönlichen Austausch über Techie-Themen, oftmals in netter abendlicher Runde bei Vereinen, Firmen oder auch in Kneipen. Hier können Informatiker Gleichgesinnte treffen, sich bei Vorträgen weiterbilden oder sich über den Arbeitsalltag austauschen. Nicht zuletzt sind bereits einige Aufträge oder Stellen über Usergroup-Kontakte vergeben worden. O’Reilly unterstützt die Usergroups bereits seit vielen Jahren , und künftig stellen wir einige von ihnen an dieser Stelle vor. Den Anfang macht die NoSQL-Usergroup in Köln – wir haben dazu mit dem Mitorganisator Dr. Frank Celler gesprochen. Seit wann gibt es die NoSQL-Usergroup in Köln? Die UG wurde im Juli 2011 gegründet. Es handelt sich um ein relativ junges Thema, aber das Interesse ist zur Zeit riesig groß. Wie viele Mitglieder gibt es derzeit, und an wendet sich die UG? Unsere Mailling-Liste ist inzwischen auf 30 angewachsen. Bei den letzten beiden Treffen kamen mehr als 20 Teilnehmer, was für eine so junge UG schon erstaunlich ist und zeigt, dass es in diesem Bereich viel spannende Neuerungen gibt. Die UG richtet sich vor allen an Entwickler FrontEnd/BackEnd, Datenbankadministratoren, …

Berlin Buzzwords 2011 am 06./07. Juni

    Nach dem Erfolg des ersten Events im Jahr 2010 findet am 6. und 7. Juni wieder die Berlin Buzzwords 2011 statt. Organisiert wird die Veranstaltung von Newthinking Communications in Zusammenarbeit  mit Simon Willnauer (Apache Lucene/Solr), Jan Lehnardt (Apache CouchDB) und Isabel Drost (Apache Mahout). Wie im letzten Jahr dreht sich auch 2011 wieder alles um die Themen skalierbare Datenanalyse, Suche und NoSQL Datenbanken. An zwei Tagen wird in einer Vielzahl von Vorträgen unter anderem über „Apache projects Hadoop, Lucene and Solr, scaling search with katta or Elastic search, NoSQL databases such as Apache CouchDB, HBase and MongoDB” gesprochen. Wer mehr zum Ablauf  erfahren möchte, kann einen Blick in das Programm für den 06. Juni und den 07. Juni der Berlin Buzzwords 2011 werfen. Tickets für die Veranstaltung können hier online bestellt werden. Der O’Reilly Verlag unterstützt die Berlin Buzzwords 2011 mit einem Buchpaket. Wir wünschen allen Teilnehmern viel Spaß!

R im praktischen Einsatz: Interview mit Bruno Hopp, Teil 2

In Teil 1 unseres Gesprächs berichtete Bruno Hopp von den Anforderungen, die das Speichern und Nutzbarmachen von riesigen Datenmengen mit sich bringen. In der heutigen Fortsetzung sprechen wir über R, eine Datenbanksoftware, die in den letzten Jahren immer mehr begeisterte Anhänger fand. Die Open Source-Statistiksoftware und Programmiersprache R ist gerade dabei, den Markt für Statistiktools umzuwerfen. Sie nutzen R seit einigen Jahrent. Wie sind Ihre Erfahrungen? Das sind ganz hervorragende! Ich bin auf R aufmerksam geworden, als R noch bei Versionsnummer 1.10 herum dümpelte. Vor Jahren hatte ich für mich privat Linux als leistungs­starkes System entdeckt, aber es gab nur unbedeutende open-source Lösungen für empirischen Datenanalysen. Gretl gibt es für die Ökonometrie (Teil der Wirtschafts­wissenschaften), und Computer-Algebra Systeme wie Octave gibt es auch schon eine Weile. Leider sind sie in den Sozialwissenschaften bisher ungebräuchlich bis unbekannt. Unix und Linux wird oft von Menschen verwendet, die es nicht nur wegen seiner Offenheit schätzen (im Sinne von “kostenlos”), sondern die wirklich wissen, was sie da tun. Da hat man keine Angst, einen C-compiler, Perl oder Python zu …

R im praktischen Einsatz: Interview mit Bruno Hopp, Teil 1

Vor einiger Zeit stellte ich Ihnen an dieser Stelle die Statistiksoftware R vor. Nun habe ich mit Bruno Hopp gesprochen, der zum einen auf einen großen Erfahrungsschatz im Bereich der Datenanalyse zurückgreifen kann, und zum anderen die Vorzüge von Open Source-Software im allgemeinen und der freien Software R im besonderen sehr gut kennt und schätzt. Lesen Sie in Teil 1 des Interviews zunächst, vor welchen Herausforderungen Bruno Hopp in seiner täglichen Arbeit in einer der in den Sozialwissenschaften größten Datenbanksammlungen der Welt steht. In Kürze folgt Teil 2, in dem wir uns besonders über R unterhielten. Herr Hopp, am GESIS Leibniz-Institut für Sozialwissenschaften, an dem Sie seit vielen Jahren arbeiten, werden große Datenmengen gespeichert. Um welche Daten handelt es sich dabei? Es handelt sich um ca. 7000 (siebentausend) meist empirische Studien aus den Sozialwissenschaften nach 1945 zu den verschiedensten Themen, etwa Bildung, Einkommen, ökonomische Verhältnisse und politischen Einstellungen –  namentlich z.B. die Politbarometer, der ALLBUS (Allgemeine Bevölkerungs­umfrage), die Eurobarometer, der EVS (European Value Study). Ihre Zahl lässt sich nicht ganz präzise fassen, da wir regelmässig …

PostgreSQL: Entwickler Simon Riggs im Interview

Nutzen Sie OpenStreetMap? Telefonieren Sie via Skype? Oder spielen Sie World of Warcraft? All diese Angebote nutzen PostgreSQL, um ihre gewaltigen Datensammlungen vorzuhalten. Auch Banken, Regierungsbehörden oder Universitäten setzen auf das Open Source-Datenbanksystem, wie diese Liste der “Featured User” zeigt. Nicht verwunderlich, denn PostgreSQL kann soviele Daten aufnehmen, wie der eigene Speicher hergibt – einige Petabyte sind das beispielsweise bei Yahoo!, das PostgreSQL zur Verarbeitung von Kundendaten einsetzt. Gleichzeitig läuft es stabil auf allen großen Serversystemen und kann frei erweitert und angepasst werden. Unsere britische Kollegin Josette Garcia hat gerade mit einem der PostgreSQL-Entwickler, Simon Riggs, gesprochen. In ihrem Interview wird eines der Erfolgsgeheimnisse von PostgreSQL klar: Eine Entwickler-Community, die routiniert und lösungsorientiert an dessen Weiterentwicklung arbeitet. “Jedes Jahr gibt es ein Major Release”, erklärt Riggs. “Wir überlegen, was dringend benötigt wird, entwerfen gemeinsam eine Lösung und implementieren diese dann.” Nach einigen Tests sei der Code dann solide genug, um Eingang in PostgreSQL zu finden. Riggs bestätigt, dass PostgreSQL sehr häufig eingesetzt wird – und das ohne große Marketingstrategien. Die meisten Techies kennen PostgreSQL, und …