Reinforcement Learning : An Introduction /
Contiene: I. El problema: 1) Introducción; 2) Retroaliemntación evaluativa; 3) El problema del aprendizaje por refuerzo. II. Métodos de solución elementales: 4) Programación dinámica; 5) Método de Montecarlo; 6) Aprendizaje temporal-diferencia. III. Vista unificada: 7) Rastros de elegibilidad; 8) Ge...
में बचाया:
| मुख्य लेखक: | |
|---|---|
| अन्य लेखक: | |
| स्वरूप: | पुस्तक |
| भाषा: | अंग्रेज़ी |
| प्रकाशित: |
Cambridge, EUA :
Massachusetts Institute of Technology,
1998, c1998
|
| श्रृंखला: | (Adaptative Computation and Machine Learning)
(A Bradford Book) |
| विषय: | |
| टैग: |
कोई टैग नहीं, इस रिकॉर्ड को टैग करने वाले पहले व्यक्ति बनें!
|
MARC
| LEADER | 00000nam^a2200000^a^4500 | ||
|---|---|---|---|
| 001 | 000378568 | ||
| 005 | 20250521000000.0 | ||
| 009 | 20260310120458.901 | ||
| 020 | |a 978-0-262-19398-6 | ||
| 037 | |a Acervo ITESO - Biblioteca | ||
| 041 | |a ING | ||
| 082 | |a 006. 31 |b SUT | ||
| 100 | |a Sutton, Richard S. |e (autor) | ||
| 245 | 1 | 0 | |a Reinforcement Learning : |b An Introduction / |c R.S. Sutton, A.G. Barto. |
| 264 | 4 | |a Cambridge, EUA : |b Massachusetts Institute of Technology, |c 1998, c1998 | |
| 336 | |a texto |b txt |2 rdacontenido | ||
| 337 | |a sin mediación |b n |2 rdamedio | ||
| 338 | |a volumen |b nc |2 rdasoporte | ||
| 440 | 1 | |a (Adaptative Computation and Machine Learning) | |
| 440 | 2 | |a (A Bradford Book) | |
| 520 | |a Contiene: I. El problema: 1) Introducción; 2) Retroaliemntación evaluativa; 3) El problema del aprendizaje por refuerzo. II. Métodos de solución elementales: 4) Programación dinámica; 5) Método de Montecarlo; 6) Aprendizaje temporal-diferencia. III. Vista unificada: 7) Rastros de elegibilidad; 8) Generalización y función de aproximación; 9) Planificación y aprendizaje; 10) Dimensiones del aprendizaje por refuerzo. | ||
| 521 | |a Peticiones 2016 Juan Diego Sánchez Torres | ||
| 649 | |a XX | ||
| 650 | |a Aprendizaje Automático (Inteligencia Artificial) - |x Tema Principal | ||
| 650 | |a Inteligencia Artificial | ||
| 650 | |a Programación Dinámica | ||
| 650 | |a Método de Montecarlo | ||
| 650 | |a Ingeniería Computacional | ||
| 700 | |a Barto, Andrew G. |e (autor) | ||
| 910 | |a Fondo General | ||
| 920 | |a Impresos - Libros | ||
| 930 | |a Colección General | ||
| 905 | |a 101 | ||
| 901 | |a 0500272579 |b IT1 |c ACC |i C151691 |u 20250521 | ||
| 902 | |a https://opac.biblio.iteso.mx/vufind/Record/000378568 | ||