Elaborazione dei dati con Optimus: Potenziare le attività di preparazione dei big data per l'analisi e l'apprendimento automatico con Optimus, utilizzando Dask e PySpark.

Punteggio:   (4,7 su 5)

Elaborazione dei dati con Optimus: Potenziare le attività di preparazione dei big data per l'analisi e l'apprendimento automatico con Optimus, utilizzando Dask e PySpark. (Argenis Leon)

Recensioni dei lettori

Riepilogo:

Il libro è apprezzato per la sua copertura completa dell'elaborazione dei dati con Pandas e Optimus, che lo rende una risorsa preziosa sia per i neofiti che per i professionisti esperti dei dati. Semplifica le attività complesse sui dati e migliora l'efficienza del flusso di lavoro.

Vantaggi:

Fornisce una guida dettagliata sulla preelaborazione dei dati con Pandas e Optimus.

Svantaggi:

Eccellente per imparare e velocizzare la gestione e la trasformazione dei dati.

(basato su 4 recensioni dei lettori)

Titolo originale:

Data Processing with Optimus: Supercharge big data preparation tasks for analytics and machine learning with Optimus using Dask and PySpark

Contenuto del libro:

Scritta dal team principale di Optimus, questa guida completa vi aiuterà a capire come Optimus migliora l'intero panorama dell'elaborazione dei dati.

Caratteristiche principali:

⬤ Carica, unisci e salva piccoli e grandi dati in modo efficiente con Optimus.

⬤ Apprendi le funzioni di Optimus per l'analisi dei dati, l'ingegneria delle caratteristiche, l'apprendimento automatico, la convalida incrociata e l'NLP.

⬤ Scopri come Optimus migliora le altre tecnologie di data frame e ti aiuta a velocizzare le tue attività di elaborazione dei dati.

Descrizione del libro:

Optimus è una libreria Python che funziona come un'API unificata per la pulizia, l'elaborazione e la fusione dei dati. Può essere utilizzata per gestire dati di piccole e grandi dimensioni sul proprio laptop locale o su cluster remoti che utilizzano CPU o GPU.

Il libro inizia con le informazioni interne di Optimus e su come funziona in tandem con le tecnologie esistenti per soddisfare le esigenze di elaborazione dei dati. Imparerete quindi a usare Optimus per caricare e salvare dati da formati di testo come CSV e JSON, per esplorare file binari come Excel e per elaborare dati colonnari con Parquet, Avro e OCR. Poi, si farà conoscenza con il profilatore e i suoi tipi di dati, una caratteristica unica di Optimus Dataframe che aiuta a migliorare la qualità dei dati. Vedrete come utilizzare i grafici disponibili in Optimus, come istogrammi, grafici di frequenza, grafici a dispersione e a scatola, e capirete come Optimus vi permette di collegarvi a librerie come Plotly e Altair. Inoltre, si approfondiranno applicazioni avanzate come l'ingegneria delle caratteristiche, l'apprendimento automatico, la convalida incrociata e le funzioni di elaborazione del linguaggio naturale, esplorando i progressi di Optimus. Infine, imparerete a creare funzioni di pulizia e trasformazione dei dati e ad aggiungere un ipotetico nuovo motore di elaborazione dati con Optimus.

Alla fine di questo libro, sarete in grado di migliorare facilmente il vostro flusso di lavoro di data science con Optimus.

Cosa si impara:

⬤ Utilizzare oltre 100 funzioni di elaborazione dati su colonne e altri valori simili a stringhe.

⬤ Riforma e pivot dei dati per ottenere l'output nel formato desiderato.

⬤ Scoprire come tracciare istogrammi, grafici di frequenza, grafici a dispersione, box plot e altro ancora.

⬤ Collegare Optimus con le più diffuse librerie di visualizzazione Python, come Plotly e Altair.

⬤ Applicare le tecniche di clustering delle stringhe per normalizzarle.

⬤ Scoprire le funzioni per esplorare, correggere e rimuovere i dati di scarsa qualità.

⬤ Usare tecniche avanzate per rimuovere gli outlier dai dati.

⬤ Aggiungere motori e funzioni personalizzate per pulire, elaborare e unire i dati.

A chi è rivolto questo libro:

Questo libro si rivolge agli sviluppatori Python che desiderano esplorare, trasformare e preparare i big data per l'apprendimento automatico, l'analisi e la reportistica utilizzando Optimus, un'API unificata per lavorare con Pandas, Dask, cuDF, Dask-cuDF, Vaex e Spark. Sebbene non sia necessario, la conoscenza di Python a livello principiante sarà utile. Per installare Optimus e i suoi requisiti è necessaria una conoscenza di base della CLI. Per utilizzare le tecnologie GPU, è necessaria una scheda grafica NVIDIA compatibile con la libreria RAPIDS di NVIDIA, compatibile con Windows 10 e Linux.

Altre informazioni sul libro:

ISBN:9781801079563
Autore:
Editore:
Lingua:inglese
Rilegatura:Copertina morbida

Acquisto:

Attualmente disponibile, in magazzino.

Lo compro!

Altri libri dell'autore:

Elaborazione dei dati con Optimus: Potenziare le attività di preparazione dei big data per l'analisi...
Scritta dal team principale di Optimus, questa...
Elaborazione dei dati con Optimus: Potenziare le attività di preparazione dei big data per l'analisi e l'apprendimento automatico con Optimus, utilizzando Dask e PySpark. - Data Processing with Optimus: Supercharge big data preparation tasks for analytics and machine learning with Optimus using Dask and PySpark

Le opere dell'autore sono state pubblicate dai seguenti editori:

© Book1 Group - tutti i diritti riservati.
Il contenuto di questo sito non può essere copiato o utilizzato, né in parte né per intero, senza il permesso scritto del proprietario.
Ultima modifica: 2024.11.08 20:28 (GMT)