Reinforcement Learning : An Introduction /

Contiene: I. El problema: 1) Introducción; 2) Retroaliemntación evaluativa; 3) El problema del aprendizaje por refuerzo. II. Métodos de solución elementales: 4) Programación dinámica; 5) Método de Montecarlo; 6) Aprendizaje temporal-diferencia. III. Vista unificada: 7) Rastros de elegibilidad; 8) Ge...

पूर्ण विवरण

में बचाया:

ग्रंथसूची विवरण
मुख्य लेखक:	Sutton, Richard S. (autor)
अन्य लेखक:	Barto, Andrew G. (autor) (autor)
स्वरूप:	पुस्तक
भाषा:	अंग्रेज़ी
प्रकाशित:	Cambridge, EUA : Massachusetts Institute of Technology, 1998, c1998
श्रृंखला:	(Adaptative Computation and Machine Learning) (A Bradford Book)
विषय:	Aprendizaje Automático (Inteligencia Artificial) - > Tema Principal Inteligencia Artificial Programación Dinámica Método de Montecarlo Ingeniería Computacional
टैग:	टैग जोड़ें कोई टैग नहीं, इस रिकॉर्ड को टैग करने वाले पहले व्यक्ति बनें!

MARC


LEADER	00000nam^a2200000^a^4500
001	000378568
005	20250521000000.0
009	20260310120458.901
020			\|a 978-0-262-19398-6
037			\|a Acervo ITESO - Biblioteca
041			\|a ING
082			\|a 006. 31 \|b SUT
100			\|a Sutton, Richard S. \|e (autor)
245	1	0	\|a Reinforcement Learning : \|b An Introduction / \|c R.S. Sutton, A.G. Barto.
264		4	\|a Cambridge, EUA : \|b Massachusetts Institute of Technology, \|c 1998, c1998
336			\|a texto \|b txt \|2 rdacontenido
337			\|a sin mediación \|b n \|2 rdamedio
338			\|a volumen \|b nc \|2 rdasoporte
440		1	\|a (Adaptative Computation and Machine Learning)
440		2	\|a (A Bradford Book)
520			\|a Contiene: I. El problema: 1) Introducción; 2) Retroaliemntación evaluativa; 3) El problema del aprendizaje por refuerzo. II. Métodos de solución elementales: 4) Programación dinámica; 5) Método de Montecarlo; 6) Aprendizaje temporal-diferencia. III. Vista unificada: 7) Rastros de elegibilidad; 8) Generalización y función de aproximación; 9) Planificación y aprendizaje; 10) Dimensiones del aprendizaje por refuerzo.
521			\|a Peticiones 2016 Juan Diego Sánchez Torres
649			\|a XX
650			\|a Aprendizaje Automático (Inteligencia Artificial) - \|x Tema Principal
650			\|a Inteligencia Artificial
650			\|a Programación Dinámica
650			\|a Método de Montecarlo
650			\|a Ingeniería Computacional
700			\|a Barto, Andrew G. \|e (autor)
910			\|a Fondo General
920			\|a Impresos - Libros
930			\|a Colección General
905			\|a 101
901			\|a 0500272579 \|b IT1 \|c ACC \|i C151691 \|u 20250521
902			\|a https://opac.biblio.iteso.mx/vufind/Record/000378568

Reinforcement Learning : An Introduction /

MARC

समान संसाधन