Dai banditi alla ricerca ad albero Monte-Carlo: Il principio ottimistico applicato all'ottimizzazione e alla pianificazione

Dai banditi alla ricerca ad albero Monte-Carlo: Il principio ottimistico applicato all'ottimizzazione e alla pianificazione (Remi Munos)

Titolo originale:

From Bandits to Monte-Carlo Tree Search: The Optimistic Principle Applied to Optimization and Planning

Contenuto del libro:

Dai banditi alla ricerca ad albero Monte-Carlo: The Optimistic Principle Applied to Optimization and Planning tratta diversi aspetti del principio dell'"ottimismo di fronte all'incertezza" per problemi di ottimizzazione su larga scala con budget numerico finito. La motivazione iniziale della monografia deriva dal successo empirico del cosiddetto metodo "Monte-Carlo Tree Search", reso popolare dal Go al computer ed esteso a molti altri giochi, nonché a problemi di ottimizzazione e pianificazione.

La monografia pone le basi teoriche del settore, caratterizzando la complessità dei problemi di ottimizzazione e progettando algoritmi efficienti con garanzie di prestazioni. La direzione principale seguita in questa monografia consiste nel decomporre un problema decisionale complesso (come un problema di ottimizzazione in un grande spazio di ricerca) in una sequenza di decisioni elementari, dove ogni decisione della sequenza viene risolta utilizzando un "bandito a più braccia" stocastico (modello matematico per le decisioni in ambienti stocastici). Questo definisce una ricerca gerarchica che ha la caratteristica di iniziare l'esplorazione con un campionamento quasi uniforme dello spazio e poi di concentrarsi, a scale diverse, sulle aree più promettenti (utilizzando il principio dell'ottimismo), fino a eseguire una ricerca locale intorno all'optima globale della funzione.

Questa monografia considera il problema dell'ottimizzazione di funzioni in spazi di ricerca generali (come spazi metrici, spazi strutturati, alberi e grafi) e il problema della pianificazione nei processi decisionali di Markov. Il suo contributo principale è una classe di algoritmi ottimistici gerarchici con istanziazioni algoritmiche diverse a seconda che le valutazioni siano rumorose o prive di rumore e che sia nota o sconosciuta una misura della ''morbidezza'' locale della funzione intorno al massimo globale.

Altre informazioni sul libro:

ISBN:9781601987662
Autore:
Editore:
Lingua:inglese
Rilegatura:Copertina morbida

Acquisto:

Attualmente disponibile, in magazzino.

Lo compro!

Altri libri dell'autore:

Dai banditi alla ricerca ad albero Monte-Carlo: Il principio ottimistico applicato...
Dai banditi alla ricerca ad albero Monte-Carlo: The Optimistic...
Dai banditi alla ricerca ad albero Monte-Carlo: Il principio ottimistico applicato all'ottimizzazione e alla pianificazione - From Bandits to Monte-Carlo Tree Search: The Optimistic Principle Applied to Optimization and Planning

Le opere dell'autore sono state pubblicate dai seguenti editori:

© Book1 Group - tutti i diritti riservati.
Il contenuto di questo sito non può essere copiato o utilizzato, né in parte né per intero, senza il permesso scritto del proprietario.
Ultima modifica: 2024.11.08 20:28 (GMT)