GLOSARIO DE SEGURIDAD SOCIAL

Temporal Difference Learning

Método de aprendizaje por refuerzo que actualiza las estimaciones de valor utilizando la diferencia entre estimaciones sucesivas. En lugar de esperar a recibir una recompensa final, el algoritmo actualiza continuamente sus estimaciones de valor basándose en la retroalimentación inmediata recibida del entorno. Este enfoque permite un aprendizaje más rápido y eficiente en entornos donde las recompensas son escasas o demoradas.
Fuente:

TN University. (2024). Diccionario sobre inteligencia artificial: 100 conceptos claves sobre sistemas inteligentes.

Ver documento completo >
Tal vez pueda interesarte:

Publicaciones

La seguridad social en Uruguay

Esta monografía, comprende las labores que realizan el Ministerio de Trabajo y Seguridad Social, el Banco de Previsión Social, las Cajas de Jubilaciones y Pensiones de Profesionales Universitarios, Notarial de

Monitor de recursos

La Referencia

Esta plataforma permite compartir y dar visibilidad a la producción científica generada en las instituciones de educación superior y de investigación científica.

Bibliografías especializadas

Ir al contenido