Deep Reinforcement Learning in Action /
Contiene: 1) ¿Qué es el aprendizaje por refuerzo?; 2) Modelado de problemas de aprendizaje por refuerzo: procesos de decisión de Markov; 3) Predicción de los mejores estados y acciones: redes Q profundas; 4) Aprendiendo a elegir la mejor política: métodos de gradiente de políticas; 5) Abordar proble...
Salvato in:
| Autore principale: | |
|---|---|
| Altri autori: | |
| Natura: | Libro |
| Lingua: | inglese |
| Pubblicazione: |
Nueva York, EUA :
Manning,
2020, c2020
|
| Soggetti: | |
| Accesso online: | Ver documento en línea |
| Tags: |
Nessun Tag, puoi essere il primo ad aggiungerne!!
|
MARC
| LEADER | 00000nam^a2200000^a^4500 | ||
|---|---|---|---|
| 001 | 000588333 | ||
| 005 | 20251023000000.0 | ||
| 009 | 20260310132828.353 | ||
| 020 | |a 9781638350507 | ||
| 037 | |a Acervo ITESO - Biblioteca | ||
| 041 | |a ING | ||
| 082 | |a 006. 3 |b BRO | ||
| 100 | |a Brown, Brandon |e (autor) | ||
| 245 | 1 | 0 | |a Deep Reinforcement Learning in Action / |c B. Brown, A. Zai. |
| 264 | 4 | |a Nueva York, EUA : |b Manning, |c 2020, c2020 | |
| 264 | 2 | |a Birmingham, EUA : |b EBSCOhost [distribución], |c 2024 | |
| 300 | |a 1 libro electrónico en línea (1 v. sin paginación) | ||
| 300 | |a 1 recurso en línea | ||
| 336 | |a datos para computadora |b cod |2 rdacontenido | ||
| 337 | |a computadora |b c |2 rdamedio | ||
| 338 | |a recurso en línea |b cr |2 rdasoporte | ||
| 506 | 3 | |a 3 licencias | |
| 520 | |a Contiene: 1) ¿Qué es el aprendizaje por refuerzo?; 2) Modelado de problemas de aprendizaje por refuerzo: procesos de decisión de Markov; 3) Predicción de los mejores estados y acciones: redes Q profundas; 4) Aprendiendo a elegir la mejor política: métodos de gradiente de políticas; 5) Abordar problemas más complejos con métodos de actor-crítico; 6) Métodos de optimización alternativos: algoritmos evolutivos; 7) DQN distribucional: obteniendo la historia completa; 8) Exploración impulsada por la curiosidad; 9) Aprendizaje por refuerzo multiagente; 10) Aprendizaje por refuerzo interpretable: modelos de atención y relacionales; 11) En conclusión: una revisión y una hoja de ruta. | ||
| 521 | |a 2025 BO Licenciatura en Ingeniería en Inteligencia Artificial | ||
| 649 | |a XX | ||
| 650 | |a Optimización | ||
| 650 | |a Algoritmos Computacionales | ||
| 650 | |a Complejidad Computacional | ||
| 650 | |a Minería de Datos | ||
| 650 | |a Control Adaptativo | ||
| 650 | |a Cómputo Evolutivo | ||
| 650 | |a Sistemas Expertos | ||
| 650 | |a Agentes Inteligentes (Software) | ||
| 650 | |a Aprendizaje Automático (Inteligencia Artificial) - |x Tema Principal | ||
| 650 | |a Inteligencia Artificial - |x Tema Principal | ||
| 650 | |a Algoritmos | ||
| 650 | |a Autómatas Matemáticos - |x Teoría | ||
| 650 | |a Ingeniería Computacional | ||
| 700 | |a Zai, Alexander |e (autor) | ||
| 856 | 4 | 0 | |u https://ezproxy.iteso.mx/login?url=https://search.ebscohost.com/login.aspx?direct=true&scope=site&db=nlebk&db=nlabk&AN=2948737 |y Ver documento en línea |
| 910 | |a Fondo General | ||
| 920 | |a Electrónicos - Libros en Línea | ||
| 930 | |a Plataforma Digital | ||
| 905 | |a 205 | ||
| 901 | |a 588333-1 |b IT2 |c EBO |u 20250521 | ||
| 901 | |a 588333-2 |b IT2 |c EBO |u 20250521 | ||
| 901 | |a 588333-3 |b IT2 |c EBO |u 20250521 | ||
| 902 | |a https://opac.biblio.iteso.mx/vufind/Record/000588333 | ||