GLOSARIO DE SEGURIDAD SOCIAL

Temporal Difference Learning

Método de aprendizaje por refuerzo que actualiza las estimaciones de valor utilizando la diferencia entre estimaciones sucesivas. En lugar de esperar a recibir una recompensa final, el algoritmo actualiza continuamente sus estimaciones de valor basándose en la retroalimentación inmediata recibida del entorno. Este enfoque permite un aprendizaje más rápido y eficiente en entornos donde las recompensas son escasas o demoradas.
Fuente:

TN University. (2024). Diccionario sobre inteligencia artificial: 100 conceptos claves sobre sistemas inteligentes.

Ver documento completo >
Tal vez pueda interesarte:

Publicaciones

Responsabilidad del Estado

Este documento forma parte de la serie de manuales de la seguridad social que se han desarrollado en el marco del Programa Seguridad Social para Todos, los cuales tienen el

Monitor de recursos

Actuarios

Repositorio institucional de la Organización Panamericana de la Salud/Organización Mundial de Salud (OPS/OMS) que se ha consolidado como su biblioteca digital, ya que reúne los

Bibliografías especializadas

Ir al contenido