Spark ad alte prestazioni: Migliori pratiche per scalare e ottimizzare Apache Spark

Punteggio:   (4,2 su 5)

Spark ad alte prestazioni: Migliori pratiche per scalare e ottimizzare Apache Spark (Holden Karau)

Recensioni dei lettori

Riepilogo:

Il libro “High Performance Spark” offre un'esplorazione dettagliata della scrittura di codice Spark efficiente, adatta a professionisti con una conoscenza preliminare di Scala e Spark. Si concentra sull'ottimizzazione delle prestazioni e fornisce esempi di codice approfonditi, principalmente in Scala. Mentre alcuni utenti l'hanno trovata una risorsa ben strutturata e informativa, altri hanno criticato la sua accessibilità per i principianti e la forte dipendenza da Scala.

Vantaggi:

Guida completa alla scrittura di codice Spark ad alte prestazioni.
Spiegazioni dettagliate di concetti avanzati e tecniche di ottimizzazione.
Ben strutturata, con un buon equilibrio tra teoria e applicazioni pratiche.
Ricco di esempi di codice che migliorano la comprensione, soprattutto per chi ha familiarità con Scala.
Presentazione chiara, semplicità e diagrammi utili.

Svantaggi:

Non adatto ai principianti; richiede una conoscenza preliminare di Spark e Scala.
La forte attenzione a Scala può allontanare gli utenti che non hanno familiarità con il linguaggio.
Alcuni utenti hanno ritenuto che fosse troppo denso e impegnativo senza un ambiente Spark pratico.
Copertura limitata di alcuni argomenti, come lo streaming di Spark.
Alcuni l'hanno trovato noioso a causa degli eccessivi esempi di codifica.

(basato su 27 recensioni dei lettori)

Titolo originale:

High Performance Spark: Best Practices for Scaling and Optimizing Apache Spark

Contenuto del libro:

Apache Spark è straordinario quando tutto funziona. Ma se non avete visto i miglioramenti delle prestazioni che vi aspettavate o non vi sentite ancora abbastanza sicuri di usare Spark in produzione, questo libro pratico fa per voi. Gli autori Holden Karau e Rachel Warren dimostrano le ottimizzazioni delle prestazioni per aiutare le query Spark ad essere eseguite più velocemente e a gestire dati di dimensioni maggiori, utilizzando meno risorse.

Ideale per ingegneri del software, ingegneri dei dati, sviluppatori e amministratori di sistema che lavorano con applicazioni di dati su larga scala, questo libro descrive le tecniche che possono ridurre i costi dell'infrastruttura dati e le ore di lavoro degli sviluppatori. Non solo otterrete una comprensione più completa di Spark, ma imparerete anche come farlo funzionare.

Con questo libro esplorerete:

⬤ Come le nuove interfacce di Spark SQL migliorano le prestazioni rispetto alla struttura dati RDD di SQL.

⬤ La scelta tra i join di dati in Core Spark e Spark SQL.

⬤ Tecniche per ottenere il massimo dalle trasformazioni RDD standard.

⬤ Come aggirare i problemi di prestazioni nel paradigma delle coppie chiave/valore di Spark.

⬤ Scrivere codice Spark ad alte prestazioni senza Scala o JVM.

⬤ Come testare la funzionalità e le prestazioni quando si applicano i miglioramenti suggeriti.

⬤ Utilizzo delle librerie di apprendimento automatico Spark MLlib e Spark ML.

⬤ I componenti Streaming di Spark e i pacchetti esterni della comunità.

Altre informazioni sul libro:

ISBN:9781491943205
Autore:
Editore:
Rilegatura:Copertina morbida
Anno di pubblicazione:2017
Numero di pagine:358

Acquisto:

Attualmente disponibile, in magazzino.

Lo compro!

Altri libri dell'autore:

Spark ad alte prestazioni: Migliori pratiche per scalare e ottimizzare Apache Spark - High...
Apache Spark è straordinario quando tutto funziona. Ma...
Spark ad alte prestazioni: Migliori pratiche per scalare e ottimizzare Apache Spark - High Performance Spark: Best Practices for Scaling and Optimizing Apache Spark
Scalare Python con Ray: Avventure nel cloud e modelli serverless - Scaling Python with Ray:...
L'informatica serverless consente agli sviluppatori di...
Scalare Python con Ray: Avventure nel cloud e modelli serverless - Scaling Python with Ray: Adventures in Cloud and Serverless Patterns
Scalare Python con Dask: Dalla scienza dei dati all'apprendimento automatico - Scaling Python with...
I sistemi moderni contengono CPU e GPU multi-core...
Scalare Python con Dask: Dalla scienza dei dati all'apprendimento automatico - Scaling Python with Dask: From Data Science to Machine Learning

Le opere dell'autore sono state pubblicate dai seguenti editori:

© Book1 Group - tutti i diritti riservati.
Il contenuto di questo sito non può essere copiato o utilizzato, né in parte né per intero, senza il permesso scritto del proprietario.
Ultima modifica: 2024.11.08 20:28 (GMT)