Large Language Model-Based Solutions: How to Deliver Value with Cost-Effective Generative AI Applications
Imparare a costruire applicazioni economiche utilizzando modelli linguistici di grandi dimensioni.
In Large Language Model-Based Solutions: How to Deliver Value with Cost-Effective Generative AI Applications, il Principal Data Scientist di Amazon Web Services, Shreyas Subramanian, fornisce una guida pratica per gli sviluppatori e i data scientist che desiderano costruire e distribuire soluzioni basate su modelli linguistici di grandi dimensioni (LLM) a costi contenuti. Il libro affronta un'ampia gamma di argomenti chiave, tra cui la scelta del modello, la pre-elaborazione e la post-elaborazione dei dati, l'ingegnerizzazione dei prompt e la messa a punto delle istruzioni.
L'autore fa luce sulle tecniche di ottimizzazione dell'inferenza, come la quantizzazione del modello e il pruning, nonché su architetture diverse e convenienti per le tipiche applicazioni di IA generativa (Genai), tra cui i sistemi di ricerca, gli agenti di assistenza e gli agenti autonomi. Troverete inoltre:
⬤ Strategie efficaci per affrontare la sfida dell'alto costo computazionale associato agli LLM.
⬤ Assistenza per affrontare le complessità della costruzione e dell'implementazione di applicazioni di IA generativa a prezzi accessibili, comprese le tecniche di messa a punto e di inferenza.
⬤ Criteri di selezione per la scelta di un modello, con particolare attenzione ai modelli compatti, agili e specifici per il dominio.
Perfetto per gli sviluppatori e i data scientist interessati a implementare modelli fondamentali o per i leader aziendali che intendono ampliare l'uso di GenAI, Large Language Model-Based Solutions sarà utile anche ai capi progetto e ai manager, al personale di supporto tecnico e agli amministratori interessati o interessati all'argomento.
© Book1 Group - tutti i diritti riservati.
Il contenuto di questo sito non può essere copiato o utilizzato, né in parte né per intero, senza il permesso scritto del proprietario.
Ultima modifica: 2024.11.08 20:28 (GMT)