GLOSARIO DE SEGURIDAD SOCIAL

Temporal Difference Learning

Método de aprendizaje por refuerzo que actualiza las estimaciones de valor utilizando la diferencia entre estimaciones sucesivas. En lugar de esperar a recibir una recompensa final, el algoritmo actualiza continuamente sus estimaciones de valor basándose en la retroalimentación inmediata recibida del entorno. Este enfoque permite un aprendizaje más rápido y eficiente en entornos donde las recompensas son escasas o demoradas.
Fuente:

TN University. (2024). Diccionario sobre inteligencia artificial: 100 conceptos claves sobre sistemas inteligentes.

Ver documento completo >
Tal vez pueda interesarte:

Publicaciones

Monitor de recursos

Biblioteca Digital de la UNAM

Repositorio institucional de la Organización Panamericana de la Salud/Organización Mundial de Salud (OPS/OMS) que se ha consolidado como su biblioteca digital, ya que reúne los

Bibliografías especializadas

Ir al contenido