Apache Sqoop Cookbook: Sbloccare Hadoop per il vostro database relazionale

Apache Sqoop Cookbook: Sbloccare Hadoop per i database relazionali (Kathleen Ting)

Recensioni dei lettori

Riepilogo:

Il libro è apprezzato per il suo approccio pratico all'insegnamento di Sqoop attraverso ricette ed esempi pratici, che lo rendono adatto sia ai principianti sia a coloro che vogliono implementare Sqoop nel loro stack tecnologico. Tuttavia, alcuni utenti lo criticano per la mancanza di importanti dettagli sull'installazione di Sqoop, in particolare per quanto riguarda l'aggiornamento a Sqoop2.

Vantaggi:

⬤ Utile per chiunque importi dati da MySQL a un data warehouse Hadoop
⬤ offre esempi pratici e praticabili
⬤ ricette ben strutturate che espongono chiaramente problemi e soluzioni
⬤ ottimo per valutare rapidamente Sqoop
⬤ facile da capire
⬤ fornisce una base per l'implementazione di Sqoop.

Svantaggi:

⬤ Alcuni script richiedono una configurazione aggiuntiva che non è adeguatamente trattata
⬤ mancano aggiornamenti o chiarezza sulla conformità con Sqoop2
⬤ alcuni utenti ritengono che sia stato uno spreco di denaro a causa di queste sviste.

(basato su 9 recensioni dei lettori)

Titolo originale:

Apache Sqoop Cookbook: Unlocking Hadoop for Your Relational Database

Contenuto del libro:

L'integrazione dei dati provenienti da più fonti è essenziale nell'era dei big data, ma può essere un compito impegnativo e dispendioso in termini di tempo. Questo pratico ricettario fornisce decine di ricette pronte all'uso per l'utilizzo di Apache Sqoop, l'applicazione con interfaccia a riga di comando che ottimizza i trasferimenti di dati tra database relazionali e Hadoop.

Sqoop è potente e al tempo stesso sconcertante, ma grazie al formato di questo ricettario che prevede problemi-soluzioni-discussioni, imparerete rapidamente a distribuire e poi ad applicare Sqoop nel vostro ambiente. Gli autori forniscono esempi di database MySQL, Oracle e PostgreSQL su GitHub che possono essere facilmente adattati a SQL Server, Netezza, Teradata o altri sistemi relazionali.

⬤ Trasferire i dati da una singola tabella di database nel vostro ecosistema Hadoop.

⬤ Mantenere sincronizzati i dati della tabella e di Hadoop importando i dati in modo incrementale.

⬤ Importare dati da più tabelle di database.

⬤ Personalizzare i dati trasferiti richiamando varie funzioni del database.

⬤ Esportare i dati generati, elaborati o sottoposti a backup da Hadoop al database.

⬤ Eseguire Sqoop all'interno di Oozie, lo scheduler specializzato in flussi di lavoro di Hadoop.

⬤ Caricare i dati nel data warehouse di Hadoop (Hive) o nel database (HBase).

⬤ Gestire i problemi di installazione, connessione e sintassi comuni a specifici fornitori di database.

Altre informazioni sul libro:

ISBN:	9781449364625
Autore:	Kathleen Ting
Editore:	Oreilly Media
Lingua:	inglese
Rilegatura:	Copertina morbida
Anno di pubblicazione:	2013
Numero di pagine:	50

Acquisto:

Attualmente disponibile, in magazzino.

Apache Sqoop Cookbook: Sbloccare Hadoop per i database relazionali

Recensioni dei lettori

Titolo originale:

Contenuto del libro:

Altre informazioni sul libro:

Acquisto:

Altri libri dell'autore:

Le opere dell'autore sono state pubblicate dai seguenti editori: