BIDISS - Biblioteca Digital en Seguridad Social

GLOSARIO DE SEGURIDAD SOCIAL

Temporal Difference Learning

Método de aprendizaje por refuerzo que actualiza las estimaciones de valor utilizando la diferencia entre estimaciones sucesivas. En lugar de esperar a recibir una recompensa final, el algoritmo actualiza continuamente sus estimaciones de valor basándose en la retroalimentación inmediata recibida del entorno. Este enfoque permite un aprendizaje más rápido y eficiente en entornos donde las recompensas son escasas o demoradas.
Fuente:

TN University. (2024). Diccionario sobre inteligencia artificial: 100 conceptos claves sobre sistemas inteligentes.

Ver documento completo >
Tal vez pueda interesarte:

Publicaciones

Monitor de recursos

Repositorio Digital de CEPAL

Repositorio institucional de la Organización Panamericana de la Salud/Organización Mundial de Salud (OPS/OMS) que se ha consolidado como su biblioteca digital, ya que reúne los

Bibliografías especializadas

Ir al contenido