Architetture di dati moderne con Python: Costruire e distribuire pipeline di dati

Architetture di dati moderne con Python: Una guida pratica alla costruzione e all'implementazione di pipeline di dati, data warehouse e data lake con Python (Brian Lipp)

Recensioni dei lettori

Riepilogo:

Il libro offre un'esplorazione approfondita delle moderne architetture di dati, concentrandosi sull'architettura delta, sulla governance dei dati e sulla costruzione di prodotti di dati all'interno di un framework di data mesh. Inoltre, sottolinea l'importanza delle visualizzazioni dei dati e delle applicazioni pratiche in scenari reali utilizzando Python.

Vantaggi:

Copertura completa delle moderne architetture di dati, esempi pratici in Python, esplorazione approfondita della governance e dell'integrità dei dati, focus su MLOps e integrazione delle visualizzazioni dei dati, accessibile a ingegneri, analisti e manager.

Svantaggi:

Può risultare troppo tecnico per i principianti senza una precedente conoscenza delle architetture di dati, alcuni lettori potrebbero trovare la profondità eccessiva e potrebbe non coprire tutti gli argomenti in dettaglio.

(basato su 5 recensioni dei lettori)

Titolo originale:

Modern Data Architectures with Python: A practical guide to building and deploying data pipelines, data warehouses, and data lakes with Python

Contenuto del libro:

Costruire ecosistemi di dati scalabili e affidabili utilizzando Data Mesh, Databricks Spark e Kafka.

Caratteristiche principali:

⬤ Sviluppare le moderne competenze sui dati utilizzate nelle tecnologie emergenti.

⬤ Apprendere metodologie di progettazione pragmatiche come Data Mesh e data lakehouse.

⬤ Acquisire una comprensione più approfondita della governance dei dati.

⬤ L'acquisto del libro stampato o del Kindle include un eBook PDF gratuito.

Descrizione del libro:

Modern Data Architectures with Python vi insegnerà come incorporare senza problemi i flussi di lavoro di machine learning e data science nelle vostre piattaforme di dati aperti. Imparerete a prendere i vostri dati e a creare lakehouse aperti che funzionino con qualsiasi tecnologia utilizzando tecniche collaudate, tra cui l'architettura a medaglione e Delta Lake.

Partendo dalle basi, questo libro vi aiuterà a costruire pipeline su Databricks, una piattaforma di dati aperta, utilizzando SQL e Python. Si apprenderà la comprensione dei notebook e delle applicazioni scritte in Python utilizzando strumenti standard di ingegneria del software come git, pre-commit, Jenkins e Github. Successivamente, vi addentrerete nell'elaborazione dei dati in streaming e in batch utilizzando Apache Spark e Confluent Kafka. Man mano che si avanza, si apprende come distribuire le risorse utilizzando l'infrastruttura come codice e come automatizzare i flussi di lavoro e lo sviluppo del codice. Poiché la capacità di qualsiasi piattaforma di dati di gestire e lavorare con l'intelligenza artificiale e il ML è una componente vitale, esplorerete anche le basi del ML e come lavorare con i moderni strumenti MLOps. Infine, farete esperienza pratica con Apache Spark, una delle tecnologie di dati più importanti del mercato attuale.

Alla fine di questo libro, avrete accumulato un bagaglio di conoscenze pratiche e teoriche per costruire, gestire, orchestrare e architettare i vostri ecosistemi di dati.

Che cosa imparerete:

⬤ Comprendere i modelli di dati, compresa l'architettura delta.

⬤ Scoprire come aumentare le prestazioni con gli interni di Spark.

⬤ Scoprire come progettare diagrammi di dati critici.

⬤ Esplorare gli MLOp con strumenti come AutoML e MLflow.

⬤ Imparare a costruire prodotti di dati in una rete di dati.

⬤ Scoprire la governance dei dati e creare fiducia nei propri dati.

⬤ Introdurre le visualizzazioni dei dati e i cruscotti nella vostra pratica dei dati.

A chi è rivolto questo libro:

Questo libro è rivolto a sviluppatori, ingegneri analitici e manager che desiderano sviluppare ulteriormente un ecosistema di dati all'interno della propria organizzazione. Pur non essendo un prerequisito, la conoscenza di base di Python e una precedente esperienza con i dati vi aiuteranno a leggere e seguire gli esempi.

Altre informazioni sul libro:

ISBN:	9781801070492
Autore:	Brian Lipp
Editore:	Packt Pub
Lingua:	inglese
Rilegatura:	Copertina morbida

Acquisto:

Attualmente disponibile, in magazzino.

Architetture di dati moderne con Python: Una guida pratica alla costruzione e all'implementazione di pipeline di dati, data warehouse e data lake con Python

Recensioni dei lettori

Titolo originale:

Contenuto del libro:

Altre informazioni sul libro:

Acquisto:

Altri libri dell'autore:

Le opere dell'autore sono state pubblicate dai seguenti editori: