Punteggio:
Il libro fornisce una guida completa all'implementazione di operazioni di apprendimento automatico (MLOps) con Metaflow, combinando approfondimenti teorici con esempi pratici e pratici mirati alla creazione di flussi di lavoro scalabili per la scienza dei dati.
Vantaggi:⬤ Esempi pratici e progetti che insegnano efficacemente l'infrastruttura MLOps utilizzando Metaflow.
⬤ Spiegazioni chiare dei concetti, che lo rendono accessibile anche a chi non ha un background MLOps.
⬤ Buon equilibrio tra teoria e pratica, con un'attenzione particolare alle applicazioni pratiche e ai casi d'uso reali.
⬤ Elementi umoristici e opere d'arte coinvolgenti migliorano l'esperienza di lettura.
⬤ Fornisce approfondimenti preziosi al di là della documentazione ufficiale di Metaflow.
⬤ Il libro si concentra principalmente su Metaflow, il che potrebbe limitarne l'applicabilità per coloro che cercano una prospettiva più ampia su MLOps senza utilizzare Metaflow.
⬤ Alcuni lettori potrebbero aver bisogno di risorse aggiuntive al di fuori del libro per configurare l'infrastruttura Metaflow, poiché alcune impostazioni sono trattate solo nella documentazione esterna.
(basato su 7 recensioni dei lettori)
Effective Data Science Infrastructure: How to Make Data Scientists Productive
Semplificare l'infrastruttura per la scienza dei dati per dare ai data scientist un percorso efficiente dal prototipo alla produzione.
In Infrastruttura efficace per la scienza dei dati imparerete a:
Progettare un'infrastruttura per la scienza dei dati che aumenti la produttività.
Gestire l'elaborazione e l'orchestrazione nel cloud.
Distribuire l'apprendimento automatico in produzione.
Monitorare e gestire le prestazioni e i risultati.
Combinare strumenti basati sul cloud in un ambiente di data science coeso.
Sviluppare progetti di data science riproducibili utilizzando Metaflow, Conda e Docker.
Progettare applicazioni complesse per più team e grandi insiemi di dati.
Personalizzare e far crescere l'infrastruttura di data science.
Infrastruttura efficace per la scienza dei dati: Come rendere gli scienziati dei dati più produttivi è una guida pratica all'assemblaggio dell'infrastruttura per le applicazioni di data science e machine learning. Rivela i processi utilizzati da Netflix e da altre aziende orientate ai dati per gestire la loro infrastruttura di dati all'avanguardia. In questo libro imparerete a conoscere le tecniche scalabili per l'archiviazione dei dati, il calcolo, il monitoraggio degli esperimenti e l'orchestrazione, che sono rilevanti per le aziende di ogni forma e dimensione. Imparerete come rendere più produttivi i data scientist con l'infrastruttura cloud esistente, uno stack di software open source e il linguaggio idiomatico di Python.
L'autore devolve i proventi di questo libro a enti di beneficenza che sostengono le donne e i gruppi sottorappresentati nella scienza dei dati.
L'acquisto del libro stampato include un eBook gratuito nei formati PDF, Kindle e ePub di Manning Publications.
Informazioni sulla tecnologia.
Per far crescere i progetti di scienza dei dati dal prototipo alla produzione è necessaria un'infrastruttura affidabile. Utilizzando le nuove e potenti tecniche e gli strumenti contenuti in questo libro, è possibile creare uno stack infrastrutturale in grado di scalare con qualsiasi organizzazione, dalle startup alle più grandi imprese.
Il libro.
Effective Data Science Infrastructure vi insegna a costruire pipeline di dati e flussi di lavoro di progetto che potenzieranno i data scientist e i loro progetti. Basato su strumenti e concetti all'avanguardia che alimentano le operazioni sui dati di Netflix, questo libro introduce un approccio personalizzabile basato sul cloud allo sviluppo di modelli e MLOps che potrete facilmente adattare alle esigenze specifiche della vostra azienda. Con l'implementazione di questi processi pratici, i vostri team produrranno risultati migliori e più rapidi nell'applicazione della scienza dei dati e dell'apprendimento automatico a un'ampia gamma di problemi aziendali.
Cosa contiene.
Gestire l'elaborazione e l'orchestrazione nel cloud.
Combinare strumenti basati sul cloud in un ambiente di data science coeso.
Sviluppare progetti di scienza dei dati riproducibili utilizzando Metaflow, AWS e l'ecosistema di dati Python.
Progettare applicazioni complesse che richiedono dataset e modelli di grandi dimensioni e un team di data scientist.
Informazioni sul lettore.
Per ingegneri dell'infrastruttura e data scientist con mentalità ingegneristica che hanno familiarità con Python.
Informazioni sull'autore.
In Netflix, Ville Tuulos ha progettato e realizzato Metaflow, un framework full-stack per la scienza dei dati. Attualmente è amministratore delegato di una startup che si occupa di infrastrutture per la scienza dei dati.
Indice dei contenuti.
1 Introduzione all'infrastruttura della scienza dei dati.
2 La catena di strumenti della scienza dei dati.
3 Introduzione a Metaflow.
4 Scalare con il livello di calcolo.
5 Praticare la scalabilità e le prestazioni.
6 Passare alla produzione.
7 Elaborazione dei dati.
8 Utilizzo e gestione dei modelli.
9 Apprendimento automatico con lo stack completo.
© Book1 Group - tutti i diritti riservati.
Il contenuto di questo sito non può essere copiato o utilizzato, né in parte né per intero, senza il permesso scritto del proprietario.
Ultima modifica: 2024.11.08 20:28 (GMT)