GLOSARIO DE SEGURIDAD SOCIAL

Temporal Difference Learning

Método de aprendizaje por refuerzo que actualiza las estimaciones de valor utilizando la diferencia entre estimaciones sucesivas. En lugar de esperar a recibir una recompensa final, el algoritmo actualiza continuamente sus estimaciones de valor basándose en la retroalimentación inmediata recibida del entorno. Este enfoque permite un aprendizaje más rápido y eficiente en entornos donde las recompensas son escasas o demoradas.
Fuente:

TN University. (2024). Diccionario sobre inteligencia artificial: 100 conceptos claves sobre sistemas inteligentes.

Ver documento completo >
Tal vez pueda interesarte:

Publicaciones

Salud en el trabajo

En la Series Estudios, la Secretaría General ha recopilado algunos trabajos que, por su contenido, importancia y actualidad de los temas, contribuyen en forma efectiva al avance del conocimiento en

Monitor de recursos

Repositorio Digital de CEPAL

Repositorio institucional de la Organización Panamericana de la Salud/Organización Mundial de Salud (OPS/OMS) que se ha consolidado como su biblioteca digital, ya que reúne los

Bibliografías especializadas