Deep Reinforcement Learning in Action /

Contiene: 1) ¿Qué es el aprendizaje por refuerzo?; 2) Modelado de problemas de aprendizaje por refuerzo: procesos de decisión de Markov; 3) Predicción de los mejores estados y acciones: redes Q profundas; 4) Aprendiendo a elegir la mejor política: métodos de gradiente de políticas; 5) Abordar proble...

Fuld beskrivelse

Guardado en:

Bibliografiske detaljer
Hovedforfatter:	Brown, Brandon (autor)
Andre forfattere:	Zai, Alexander (autor) (autor)
Format:	Bog
Sprog:	engelsk
Udgivet:	Nueva York, EUA : Manning, 2020, c2020
Fag:	Optimización Algoritmos Computacionales Complejidad Computacional Minería de Datos Control Adaptativo Cómputo Evolutivo Sistemas Expertos Agentes Inteligentes (Software) Aprendizaje Automático (Inteligencia Artificial) - > Tema Principal Inteligencia Artificial - > Tema Principal Algoritmos Autómatas Matemáticos - > Teoría Ingeniería Computacional
Online adgang:	Ver documento en línea
Tags:	Tilføj Tag Ingen Tags, Vær først til at tagge denne postø!

MARC


LEADER	00000nam^a2200000^a^4500
001	000588333
005	20251023000000.0
009	20260526153527.402
020			\|a 9781638350507
037			\|a Acervo ITESO - Biblioteca
041			\|a ING
082			\|a 006. 3 \|b BRO
100			\|a Brown, Brandon \|e (autor)
245	1	0	\|a Deep Reinforcement Learning in Action / \|c B. Brown, A. Zai.
264		4	\|a Nueva York, EUA : \|b Manning, \|c 2020, c2020
264		2	\|a Birmingham, EUA : \|b EBSCOhost [distribución], \|c 2024
300			\|a 1 libro electrónico en línea (1 v. sin paginación)
300			\|a 1 recurso en línea
336			\|a datos para computadora \|b cod \|2 rdacontenido
337			\|a computadora \|b c \|2 rdamedio
338			\|a recurso en línea \|b cr \|2 rdasoporte
506	3		\|a 3 licencias
520			\|a Contiene: 1) ¿Qué es el aprendizaje por refuerzo?; 2) Modelado de problemas de aprendizaje por refuerzo: procesos de decisión de Markov; 3) Predicción de los mejores estados y acciones: redes Q profundas; 4) Aprendiendo a elegir la mejor política: métodos de gradiente de políticas; 5) Abordar problemas más complejos con métodos de actor-crítico; 6) Métodos de optimización alternativos: algoritmos evolutivos; 7) DQN distribucional: obteniendo la historia completa; 8) Exploración impulsada por la curiosidad; 9) Aprendizaje por refuerzo multiagente; 10) Aprendizaje por refuerzo interpretable: modelos de atención y relacionales; 11) En conclusión: una revisión y una hoja de ruta.
521			\|a 2025 BO Licenciatura en Ingeniería en Inteligencia Artificial
649			\|a XX
650			\|a Optimización
650			\|a Algoritmos Computacionales
650			\|a Complejidad Computacional
650			\|a Minería de Datos
650			\|a Control Adaptativo
650			\|a Cómputo Evolutivo
650			\|a Sistemas Expertos
650			\|a Agentes Inteligentes (Software)
650			\|a Aprendizaje Automático (Inteligencia Artificial) - \|x Tema Principal
650			\|a Inteligencia Artificial - \|x Tema Principal
650			\|a Algoritmos
650			\|a Autómatas Matemáticos - \|x Teoría
650			\|a Ingeniería Computacional
700			\|a Zai, Alexander \|e (autor)
856	4	0	\|u https://ezproxy.iteso.mx/login?url=https://search.ebscohost.com/login.aspx?direct=true&scope=site&db=nlebk&db=nlabk&AN=2948737 \|y Ver documento en línea
910			\|a Fondo General
920			\|a Electrónicos - Libros en Línea
930			\|a Plataforma Digital
905			\|a 205
901			\|a 588333-1 \|b IT2 \|c EBO \|u 20250521
901			\|a 588333-2 \|b IT2 \|c EBO \|u 20250521
901			\|a 588333-3 \|b IT2 \|c EBO \|u 20250521
902			\|a https://opac.biblio.iteso.mx/vufind/Record/000588333

Deep Reinforcement Learning in Action /

MARC

Lignende værker