Deep Reinforcement Learning in Action /

Contiene: 1) ¿Qué es el aprendizaje por refuerzo?; 2) Modelado de problemas de aprendizaje por refuerzo: procesos de decisión de Markov; 3) Predicción de los mejores estados y acciones: redes Q profundas; 4) Aprendiendo a elegir la mejor política: métodos de gradiente de políticas; 5) Abordar proble...

Descrizione completa

Salvato in:
Dettagli Bibliografici
Autore principale: Brown, Brandon (autor)
Altri autori: Zai, Alexander (autor) (autor)
Natura: Libro
Lingua:inglese
Pubblicazione: Nueva York, EUA : Manning, 2020, c2020
Soggetti:
Accesso online:Ver documento en línea
Tags: Aggiungi Tag
Nessun Tag, puoi essere il primo ad aggiungerne!!

MARC

LEADER 00000nam^a2200000^a^4500
001 000588333
005 20251023000000.0
009 20260310132828.353
020 |a 9781638350507 
037 |a Acervo ITESO - Biblioteca 
041 |a ING 
082 |a 006. 3  |b BRO 
100 |a Brown, Brandon  |e (autor) 
245 1 0 |a Deep Reinforcement Learning in Action /  |c B. Brown, A. Zai. 
264 4 |a Nueva York, EUA :  |b Manning,  |c 2020, c2020 
264 2 |a Birmingham, EUA :  |b EBSCOhost [distribución],  |c 2024 
300 |a 1 libro electrónico en línea (1 v. sin paginación) 
300 |a 1 recurso en línea 
336 |a datos para computadora  |b cod  |2 rdacontenido 
337 |a computadora  |b c  |2 rdamedio 
338 |a recurso en línea  |b cr  |2 rdasoporte 
506 3 |a 3 licencias 
520 |a Contiene: 1) ¿Qué es el aprendizaje por refuerzo?; 2) Modelado de problemas de aprendizaje por refuerzo: procesos de decisión de Markov; 3) Predicción de los mejores estados y acciones: redes Q profundas; 4) Aprendiendo a elegir la mejor política: métodos de gradiente de políticas; 5) Abordar problemas más complejos con métodos de actor-crítico; 6) Métodos de optimización alternativos: algoritmos evolutivos; 7) DQN distribucional: obteniendo la historia completa; 8) Exploración impulsada por la curiosidad; 9) Aprendizaje por refuerzo multiagente; 10) Aprendizaje por refuerzo interpretable: modelos de atención y relacionales; 11) En conclusión: una revisión y una hoja de ruta. 
521 |a 2025 BO Licenciatura en Ingeniería en Inteligencia Artificial 
649 |a XX 
650 |a Optimización 
650 |a Algoritmos Computacionales 
650 |a Complejidad Computacional 
650 |a Minería de Datos 
650 |a Control Adaptativo 
650 |a Cómputo Evolutivo 
650 |a Sistemas Expertos 
650 |a Agentes Inteligentes (Software) 
650 |a Aprendizaje Automático (Inteligencia Artificial) -  |x Tema Principal 
650 |a Inteligencia Artificial -  |x Tema Principal 
650 |a Algoritmos 
650 |a Autómatas Matemáticos -  |x Teoría 
650 |a Ingeniería Computacional 
700 |a Zai, Alexander  |e (autor) 
856 4 0 |u https://ezproxy.iteso.mx/login?url=https://search.ebscohost.com/login.aspx?direct=true&scope=site&db=nlebk&db=nlabk&AN=2948737  |y Ver documento en línea 
910 |a Fondo General 
920 |a Electrónicos - Libros en Línea 
930 |a Plataforma Digital 
905 |a 205 
901 |a 588333-1  |b IT2  |c EBO  |u 20250521 
901 |a 588333-2  |b IT2  |c EBO  |u 20250521 
901 |a 588333-3  |b IT2  |c EBO  |u 20250521 
902 |a https://opac.biblio.iteso.mx/vufind/Record/000588333