Apache Sqoop Cookbook: Sbloccare Hadoop per i database relazionali

Punteggio:   (4,3 su 5)

Apache Sqoop Cookbook: Sbloccare Hadoop per i database relazionali (Kathleen Ting)

Recensioni dei lettori

Riepilogo:

Il libro è apprezzato per il suo approccio pratico all'insegnamento di Sqoop attraverso ricette ed esempi pratici, che lo rendono adatto sia ai principianti sia a coloro che vogliono implementare Sqoop nel loro stack tecnologico. Tuttavia, alcuni utenti lo criticano per la mancanza di importanti dettagli sull'installazione di Sqoop, in particolare per quanto riguarda l'aggiornamento a Sqoop2.

Vantaggi:

Utile per chiunque importi dati da MySQL a un data warehouse Hadoop
offre esempi pratici e praticabili
ricette ben strutturate che espongono chiaramente problemi e soluzioni
ottimo per valutare rapidamente Sqoop
facile da capire
fornisce una base per l'implementazione di Sqoop.

Svantaggi:

Alcuni script richiedono una configurazione aggiuntiva che non è adeguatamente trattata
mancano aggiornamenti o chiarezza sulla conformità con Sqoop2
alcuni utenti ritengono che sia stato uno spreco di denaro a causa di queste sviste.

(basato su 9 recensioni dei lettori)

Titolo originale:

Apache Sqoop Cookbook: Unlocking Hadoop for Your Relational Database

Contenuto del libro:

L'integrazione dei dati provenienti da più fonti è essenziale nell'era dei big data, ma può essere un compito impegnativo e dispendioso in termini di tempo. Questo pratico ricettario fornisce decine di ricette pronte all'uso per l'utilizzo di Apache Sqoop, l'applicazione con interfaccia a riga di comando che ottimizza i trasferimenti di dati tra database relazionali e Hadoop.

Sqoop è potente e al tempo stesso sconcertante, ma grazie al formato di questo ricettario che prevede problemi-soluzioni-discussioni, imparerete rapidamente a distribuire e poi ad applicare Sqoop nel vostro ambiente. Gli autori forniscono esempi di database MySQL, Oracle e PostgreSQL su GitHub che possono essere facilmente adattati a SQL Server, Netezza, Teradata o altri sistemi relazionali.

⬤ Trasferire i dati da una singola tabella di database nel vostro ecosistema Hadoop.

⬤ Mantenere sincronizzati i dati della tabella e di Hadoop importando i dati in modo incrementale.

⬤ Importare dati da più tabelle di database.

⬤ Personalizzare i dati trasferiti richiamando varie funzioni del database.

⬤ Esportare i dati generati, elaborati o sottoposti a backup da Hadoop al database.

⬤ Eseguire Sqoop all'interno di Oozie, lo scheduler specializzato in flussi di lavoro di Hadoop.

⬤ Caricare i dati nel data warehouse di Hadoop (Hive) o nel database (HBase).

⬤ Gestire i problemi di installazione, connessione e sintassi comuni a specifici fornitori di database.

Altre informazioni sul libro:

ISBN:9781449364625
Autore:
Editore:
Lingua:inglese
Rilegatura:Copertina morbida
Anno di pubblicazione:2013
Numero di pagine:50

Acquisto:

Attualmente disponibile, in magazzino.

Lo compro!

Altri libri dell'autore:

Apache Sqoop Cookbook: Sbloccare Hadoop per i database relazionali - Apache Sqoop Cookbook:...
L'integrazione dei dati provenienti da più fonti è...
Apache Sqoop Cookbook: Sbloccare Hadoop per i database relazionali - Apache Sqoop Cookbook: Unlocking Hadoop for Your Relational Database

Le opere dell'autore sono state pubblicate dai seguenti editori:

© Book1 Group - tutti i diritti riservati.
Il contenuto di questo sito non può essere copiato o utilizzato, né in parte né per intero, senza il permesso scritto del proprietario.
Ultima modifica: 2024.11.08 20:28 (GMT)