GLOSARIO DE SEGURIDAD SOCIAL

Temporal Difference Learning

Método de aprendizaje por refuerzo que actualiza las estimaciones de valor utilizando la diferencia entre estimaciones sucesivas. En lugar de esperar a recibir una recompensa final, el algoritmo actualiza continuamente sus estimaciones de valor basándose en la retroalimentación inmediata recibida del entorno. Este enfoque permite un aprendizaje más rápido y eficiente en entornos donde las recompensas son escasas o demoradas.
Fuente:

TN University. (2024). Diccionario sobre inteligencia artificial: 100 conceptos claves sobre sistemas inteligentes.

Ver documento completo >
Tal vez pueda interesarte:

Publicaciones

Hospital plans in case of disaster

The purpose of this book is to present the most efficient way of organizing hospital services and training the staff involved, in order to relief the always critical problems caused

Monitor de recursos

Memoria Estadística del IMSS

Con el uso de esta gran herramienta, puede explorar proyecciones globales de la OIT acerca del empleo, crear sus gráficos y descargar sus datos con

Bibliografías especializadas

Ir al contenido