Big Data in der Praxis - Lösungen mit Hadoop, Spark, HBase und Hive. Daten speichern, aufbereiten, visualisieren. 2. erweiterte Auflage

von: Jonas Freiknecht, Stefan Papp

Carl Hanser Fachbuchverlag, 2018

ISBN: 9783446458062 , 551 Seiten

2. Auflage

Format: ePUB, PDF

Kopierschutz: Wasserzeichen

Mac OSX,Windows PC für alle DRM-fähigen eReader Apple iPad, Android Tablet PC's Apple iPod touch, iPhone und Android Smartphones

Preis: 39,99 EUR

eBook anfordern eBook anfordern

Mehr zum Inhalt

Big Data in der Praxis - Lösungen mit Hadoop, Spark, HBase und Hive. Daten speichern, aufbereiten, visualisieren. 2. erweiterte Auflage


 

Diese komplett überarbeitete Neuauflage bringt Ihnen das Thema Big Data auf sehr praktische Art und Weise nahe. Sie lernen Technologien, Tools und Methoden kennen, entwickeln Beispiel-Lösungen und erfahren, wie Sie bestehende Systeme vorausschauend auf die mit Big Data einhergehenden Herausforderungen vorbereiten.
Dazu werden Sie neben den bekannten Apache-Projekten wie Hadoop, Hive und HBase auch einige weniger bekannte Frameworks wie Apache UIMA oder Apache OpenNLP kennenlernen, um gezielt die Verarbeitung unstrukturierter Daten zu lernen. Alle hier verwendeten Software-Komponenten stehen im vollen Umfang kostenlos im Internet zur Verfügung.
Gemeinsam mit den Autoren bauen Sie Schritt für Schritt viele kleinere Projekte auf bis hin zu einer fertigen und funktionstüchtigen Implementierung.
Ziel des Buches ist es, Sie auf den Effekt und den Mehrwert der neuen Möglichkeiten aufmerksam zu machen, sodass Sie diese konstruktiv in Ihr Unternehmen tragen können und für sich und Ihre Kollegen somit ein Bewusstsein für den Wert Ihrer Daten schaffen
Die zweite Auflage ergänzt das Buch um zahlreiche neue Themen wie Apache Spark, Apache Kafka und weitere Technologien, die vor allem darauf abzielen, Antwortzeiten kurz zu halten und so ein interaktives Arbeiten zu ermöglichen. Ebenso werden die für Firmen so wichtigen Themen Data Governance und Sicherheit behandelt.
Im Internet: 18 fertige Beispiel-Projekte auf Basis von Hadoop, HBase, Hive und D3.js plus Videotutorials
EXTRA: E-Book inside

Jonas Freiknecht beschäftigt sich bei der REWE Systems GmbH mit der Konsolidierung, Verarbeitung und Auswertung großer Datenmengen. Nebenbei promoviert er an der Universität Mannheim zum Thema Visualisierung und Simulation und schreibt digital und analog über verschiene IT-Themen.
Stefan Papp ist fest davon überzeugt, dass neue Wege Daten zu erforschen in den nächsten Jahrzehnten die Welt verändern wird. Als Evangelist und Architekt unterstützt er Unternehmen dabei, ihren Umgang mit Daten neu zu definieren und Big Data-Technologien zu nutzen, um neue Geschäftsmodelle zu erschließen. Außerdem unterrichtet er an Fachhochschulen, arbeitet als Hadoop-Trainer und tritt als Speaker bei Konferenzen auf.