GLOSARIO DE SEGURIDAD SOCIAL

Temporal Difference Learning

Método de aprendizaje por refuerzo que actualiza las estimaciones de valor utilizando la diferencia entre estimaciones sucesivas. En lugar de esperar a recibir una recompensa final, el algoritmo actualiza continuamente sus estimaciones de valor basándose en la retroalimentación inmediata recibida del entorno. Este enfoque permite un aprendizaje más rápido y eficiente en entornos donde las recompensas son escasas o demoradas.
Fuente:

TN University. (2024). Diccionario sobre inteligencia artificial: 100 conceptos claves sobre sistemas inteligentes.

Ver documento completo >
Tal vez pueda interesarte:

Publicaciones

Monitor de recursos

Bibliografías especializadas

Ir al contenido