Infrastruttura efficace per la scienza dei dati: Aumentare la produttività degli scienziati dei dati

Infrastruttura efficace per la scienza dei dati: Come rendere produttivi gli scienziati dei dati (Ville Tuulos)

Recensioni dei lettori

Riepilogo:

Il libro fornisce una guida completa all'implementazione di operazioni di apprendimento automatico (MLOps) con Metaflow, combinando approfondimenti teorici con esempi pratici e pratici mirati alla creazione di flussi di lavoro scalabili per la scienza dei dati.

Vantaggi:

⬤ Esempi pratici e progetti che insegnano efficacemente l'infrastruttura MLOps utilizzando Metaflow.
⬤ Spiegazioni chiare dei concetti, che lo rendono accessibile anche a chi non ha un background MLOps.
⬤ Buon equilibrio tra teoria e pratica, con un'attenzione particolare alle applicazioni pratiche e ai casi d'uso reali.
⬤ Elementi umoristici e opere d'arte coinvolgenti migliorano l'esperienza di lettura.
⬤ Fornisce approfondimenti preziosi al di là della documentazione ufficiale di Metaflow.

Svantaggi:

⬤ Il libro si concentra principalmente su Metaflow, il che potrebbe limitarne l'applicabilità per coloro che cercano una prospettiva più ampia su MLOps senza utilizzare Metaflow.
⬤ Alcuni lettori potrebbero aver bisogno di risorse aggiuntive al di fuori del libro per configurare l'infrastruttura Metaflow, poiché alcune impostazioni sono trattate solo nella documentazione esterna.

(basato su 7 recensioni dei lettori)

Titolo originale:

Effective Data Science Infrastructure: How to Make Data Scientists Productive

Contenuto del libro:

Semplificare l'infrastruttura per la scienza dei dati per dare ai data scientist un percorso efficiente dal prototipo alla produzione.

In Infrastruttura efficace per la scienza dei dati imparerete a:

Progettare un'infrastruttura per la scienza dei dati che aumenti la produttività.

Gestire l'elaborazione e l'orchestrazione nel cloud.

Distribuire l'apprendimento automatico in produzione.

Monitorare e gestire le prestazioni e i risultati.

Combinare strumenti basati sul cloud in un ambiente di data science coeso.

Sviluppare progetti di data science riproducibili utilizzando Metaflow, Conda e Docker.

Progettare applicazioni complesse per più team e grandi insiemi di dati.

Personalizzare e far crescere l'infrastruttura di data science.

Infrastruttura efficace per la scienza dei dati: Come rendere gli scienziati dei dati più produttivi è una guida pratica all'assemblaggio dell'infrastruttura per le applicazioni di data science e machine learning. Rivela i processi utilizzati da Netflix e da altre aziende orientate ai dati per gestire la loro infrastruttura di dati all'avanguardia. In questo libro imparerete a conoscere le tecniche scalabili per l'archiviazione dei dati, il calcolo, il monitoraggio degli esperimenti e l'orchestrazione, che sono rilevanti per le aziende di ogni forma e dimensione. Imparerete come rendere più produttivi i data scientist con l'infrastruttura cloud esistente, uno stack di software open source e il linguaggio idiomatico di Python.

L'autore devolve i proventi di questo libro a enti di beneficenza che sostengono le donne e i gruppi sottorappresentati nella scienza dei dati.

L'acquisto del libro stampato include un eBook gratuito nei formati PDF, Kindle e ePub di Manning Publications.

Informazioni sulla tecnologia.

Per far crescere i progetti di scienza dei dati dal prototipo alla produzione è necessaria un'infrastruttura affidabile. Utilizzando le nuove e potenti tecniche e gli strumenti contenuti in questo libro, è possibile creare uno stack infrastrutturale in grado di scalare con qualsiasi organizzazione, dalle startup alle più grandi imprese.

Il libro.

Effective Data Science Infrastructure vi insegna a costruire pipeline di dati e flussi di lavoro di progetto che potenzieranno i data scientist e i loro progetti. Basato su strumenti e concetti all'avanguardia che alimentano le operazioni sui dati di Netflix, questo libro introduce un approccio personalizzabile basato sul cloud allo sviluppo di modelli e MLOps che potrete facilmente adattare alle esigenze specifiche della vostra azienda. Con l'implementazione di questi processi pratici, i vostri team produrranno risultati migliori e più rapidi nell'applicazione della scienza dei dati e dell'apprendimento automatico a un'ampia gamma di problemi aziendali.

Cosa contiene.

Gestire l'elaborazione e l'orchestrazione nel cloud.

Combinare strumenti basati sul cloud in un ambiente di data science coeso.

Sviluppare progetti di scienza dei dati riproducibili utilizzando Metaflow, AWS e l'ecosistema di dati Python.

Progettare applicazioni complesse che richiedono dataset e modelli di grandi dimensioni e un team di data scientist.

Informazioni sul lettore.

Per ingegneri dell'infrastruttura e data scientist con mentalità ingegneristica che hanno familiarità con Python.

Informazioni sull'autore.

In Netflix, Ville Tuulos ha progettato e realizzato Metaflow, un framework full-stack per la scienza dei dati. Attualmente è amministratore delegato di una startup che si occupa di infrastrutture per la scienza dei dati.

Indice dei contenuti.

1 Introduzione all'infrastruttura della scienza dei dati.

2 La catena di strumenti della scienza dei dati.

3 Introduzione a Metaflow.

4 Scalare con il livello di calcolo.

5 Praticare la scalabilità e le prestazioni.

6 Passare alla produzione.

7 Elaborazione dei dati.

8 Utilizzo e gestione dei modelli.

9 Apprendimento automatico con lo stack completo.

Altre informazioni sul libro:

ISBN:	9781617299193
Autore:	Ville Tuulos
Editore:	Manning Pubn
Lingua:	inglese
Rilegatura:	Copertina morbida
Anno di pubblicazione:	2022
Numero di pagine:	325

Acquisto:

Attualmente disponibile, in magazzino.

Infrastruttura efficace per la scienza dei dati: Come rendere produttivi gli scienziati dei dati

Recensioni dei lettori

Titolo originale:

Contenuto del libro:

Altre informazioni sul libro:

Acquisto:

Altri libri dell'autore:

Le opere dell'autore sono state pubblicate dai seguenti editori: