Deep Reinforcement Learning in Action /
Contiene: 1) ¿Qué es el aprendizaje por refuerzo?; 2) Modelado de problemas de aprendizaje por refuerzo: procesos de decisión de Markov; 3) Predicción de los mejores estados y acciones: redes Q profundas; 4) Aprendiendo a elegir la mejor política: métodos de gradiente de políticas; 5) Abordar proble...
I tiakina i:
| Kaituhi matua: | |
|---|---|
| Ētahi atu kaituhi: | |
| Hōputu: | Pukapuka |
| Reo: | Ingarihi |
| I whakaputaina: |
Nueva York, EUA :
Manning,
2020, c2020
|
| Ngā marau: | |
| Urunga tuihono: | Ver documento en línea |
| Ngā Tūtohu: |
Kāore He Tūtohu, Me noho koe te mea tuatahi ki te tūtohu i tēnei pūkete!
|
Ipurangi
Ver documento en línea| Tau karanga: |
006. 3 BRO
|
||
|---|---|---|---|
| Ejemplar 588333-1 |
Disponible
Préstamo en línea
|
Kohinga:
Libros electrónicos en línea
|
Ngā tuhipoka:
Consultar en línea
|
| Ejemplar 588333-2 |
Disponible
Préstamo en línea
|
Kohinga:
Libros electrónicos en línea
|
Ngā tuhipoka:
Consultar en línea
|
| Ejemplar 588333-3 |
Disponible
Préstamo en línea
|
Kohinga:
Libros electrónicos en línea
|
Ngā tuhipoka:
Consultar en línea
|