Imparare Spark: Analisi dei dati alla velocità della luce

Punteggio:   (4,7 su 5)

Imparare Spark: Analisi dei dati alla velocità della luce (S. Damji Jules)

Recensioni dei lettori

Riepilogo:

Questo libro è una risorsa completa per l'apprendimento di Apache Spark e offre approfondimenti teorici e pratici. È ben organizzato, si concentra sui vari componenti di Spark e include utili immagini ed esempi di codice. Tuttavia, potrebbe essere troppo elementare per gli utenti esperti e richiede alcune conoscenze di programmazione precedenti.

Vantaggi:

Copre gli aspetti teorici e pratici di Spark in modo molto approfondito
ben organizzato e facile da seguire
fornisce istruzioni chiare, immagini utili ed esempi di codice
fornisce una buona introduzione a Spark
include capitoli su Delta Lake e MLlib
adatto sia ai principianti che agli utenti più esperti in cerca di un aggiornamento.

Svantaggi:

Alcuni argomenti possono essere trattati in modo troppo superficiale
richiede una comprensione da elementare a intermedia della programmazione e dell'analisi dei dati
non è ideale per gli utenti che hanno già esperienza con Spark
la configurazione può essere impegnativa, soprattutto per gli utenti Mac e Windows
potrebbe non essere adatto a chi è completamente alle prime armi con la tecnologia.

(basato su 33 recensioni dei lettori)

Titolo originale:

Learning Spark: Lightning-Fast Data Analytics

Contenuto del libro:

I dati sono più grandi, arrivano più velocemente e sono disponibili in una varietà di formati, e tutti devono essere elaborati su scala per l'analisi o l'apprendimento automatico. Ma come si possono elaborare in modo efficiente carichi di lavoro così diversi? Ecco Apache Spark.

Aggiornata con Spark 3. 0, questa seconda edizione mostra ai data engineer e ai data scientist perché la struttura e l'unificazione in Spark sono importanti. In particolare, questo libro spiega come eseguire analisi dei dati semplici e complesse e utilizzare algoritmi di apprendimento automatico. Grazie a passaggi passo-passo, snippet di codice e notebook, sarete in grado di:

⬤ Apprendere le API strutturate di alto livello di Python, SQL, Scala o Java.

⬤ Comprendere le operazioni di Spark e SQL Engine.

⬤ Ispettare, mettere a punto ed eseguire il debug delle operazioni di Spark con le configurazioni di Spark e l'interfaccia utente di Spark.

⬤ Collegarsi a fonti di dati: JSON, Parquet, CSV, Avro, ORC, Hive, S3 o Kafka.

⬤ Eseguire analisi su dati batch e in streaming utilizzando Structured Streaming.

⬤ Costruire pipeline di dati affidabili con Delta Lake e Spark open source.

⬤ Sviluppare pipeline di apprendimento automatico con MLlib e produrre modelli con MLflow.

Altre informazioni sul libro:

ISBN:9781492050049
Autore:
Editore:
Rilegatura:Copertina morbida
Anno di pubblicazione:2020
Numero di pagine:300

Acquisto:

Attualmente disponibile, in magazzino.

Lo compro!

Altri libri dell'autore:

Imparare Spark: Analisi dei dati alla velocità della luce - Learning Spark: Lightning-Fast Data...
I dati sono più grandi, arrivano più velocemente e...
Imparare Spark: Analisi dei dati alla velocità della luce - Learning Spark: Lightning-Fast Data Analytics

Le opere dell'autore sono state pubblicate dai seguenti editori:

© Book1 Group - tutti i diritti riservati.
Il contenuto di questo sito non può essere copiato o utilizzato, né in parte né per intero, senza il permesso scritto del proprietario.
Ultima modifica: 2024.11.08 20:28 (GMT)