Scienza dei dati con Python e Dask

Punteggio:   (4,5 su 5)

Scienza dei dati con Python e Dask (Jesse Daniel)

Recensioni dei lettori

Riepilogo:

Il libro serve come introduzione a Dask e alle sue funzionalità, ma ha recensioni contrastanti per quanto riguarda il pubblico di riferimento e la profondità delle informazioni. Sebbene offra una buona panoramica e confronti con Pandas, spesso si addentra in concetti elementari che potrebbero non essere rilevanti per i lettori a cui è destinato.

Vantaggi:

Buona introduzione per i principianti
solide spiegazioni delle strutture dati di Dask
efficace confronto con Pandas
preziosa risorsa per comprendere i concetti della scienza dei dati
sintassi e casi d'uso chiari.

Svantaggi:

Troppo elementare per gli utenti intermedi
include concetti elementari irrilevanti
il layout e la struttura potrebbero essere migliorati
si notano alcuni problemi tecnici
il contenuto potrebbe essere troppo dettagliato per il pubblico a cui è destinato.

(basato su 6 recensioni dei lettori)

Titolo originale:

Data Science with Python and Dask

Contenuto del libro:

Sintesi

Dask è uno strumento nativo di analisi parallela progettato per integrarsi perfettamente con le librerie che già utilizzate, tra cui Pandas, NumPy e Scikit-Learn. Con Dask è possibile elaborare e lavorare con enormi insiemi di dati, utilizzando gli strumenti già in uso. Data Science with Python and Dask è la guida all'utilizzo di Dask per i vostri progetti di dati senza cambiare il vostro modo di lavorare.

L'acquisto del libro stampato include un eBook gratuito nei formati PDF, Kindle e ePub di Manning Publications. Troverete le istruzioni per la registrazione all'interno del libro stampato.

Informazioni sulla tecnologia

Una pipeline di dati efficiente è fondamentale per il successo di un progetto di data science. Dask è una libreria flessibile per il calcolo parallelo in Python che semplifica la creazione di flussi di lavoro intuitivi per l'acquisizione e l'analisi di grandi insiemi di dati distribuiti. Dask fornisce una programmazione dinamica delle attività e collezioni parallele che estendono le funzionalità di NumPy, Pandas e Scikit-learn, consentendo agli utenti di scalare il loro codice da un singolo laptop a un cluster di centinaia di macchine con facilità.

Informazioni sul libro

Data Science with Python and Dask vi insegna a costruire progetti scalabili in grado di gestire enormi insiemi di dati. Dopo aver conosciuto il framework Dask, analizzerete i dati del database dei biglietti del parcheggio di New York e utilizzerete i DataFrames per ottimizzare il processo. Quindi, creerete modelli di apprendimento automatico utilizzando Dask-ML, realizzerete visualizzazioni interattive e costruirete cluster utilizzando AWS e Docker.

Che cosa c'è dentro?

⬤ Lavorare con grandi insiemi di dati strutturati e non strutturati.

⬤ Visualizzazione con Seaborn e Datashader.

⬤ Implementazione di algoritmi personalizzati.

⬤ Costruire applicazioni distribuite con Dask Distributed.

⬤ Impacchettare e distribuire le applicazioni Dask.

Informazioni sul lettore

Per data scientist e sviluppatori con esperienza nell'uso di Python e dello stack PyData.

Informazioni sull'autore

Jesse Daniel è uno sviluppatore Python esperto. Ha insegnato Python per la scienza dei dati all'Università di Denver e dirige un team di scienziati dei dati presso un'azienda di tecnologia dei media con sede a Denver.

Indice dei contenuti

PARTE 1 - Gli elementi costitutivi dell'informatica scalabile.

⬤ Perché l'informatica scalabile è importante.

⬤ Introduzione a Dask.

PARTE 2 - Lavorare con i dati strutturati usando Dask DataFrames.

⬤ Introduzione ai DataFrames di Dask.

⬤ Caricamento dei dati nei DataFrames.

⬤ Pulizia e trasformazione dei DataFrames.

⬤ Riassumere e analizzare i DataFrames.

⬤ Visualizzazione di DataFrames con Seaborn.

⬤ Visualizzazione dei dati di localizzazione con Datashader.

PARTE 3 - Estendere e distribuire Dask.

⬤ Lavorare con le borse e gli array.

⬤ Apprendimento automatico con Dask-ML.

⬤ Scalare e distribuire Dask.

Altre informazioni sul libro:

ISBN:9781617295607
Autore:
Editore:
Rilegatura:Copertina morbida
Anno di pubblicazione:2019
Numero di pagine:296

Acquisto:

Attualmente disponibile, in magazzino.

Lo compro!

Altri libri dell'autore:

Scienza dei dati con Python e Dask - Data Science with Python and Dask
Sintesi Dask è uno strumento nativo di analisi parallela progettato per integrarsi...
Scienza dei dati con Python e Dask - Data Science with Python and Dask

Le opere dell'autore sono state pubblicate dai seguenti editori:

© Book1 Group - tutti i diritti riservati.
Il contenuto di questo sito non può essere copiato o utilizzato, né in parte né per intero, senza il permesso scritto del proprietario.
Ultima modifica: 2024.11.08 20:28 (GMT)