GLOSARIO DE SEGURIDAD SOCIAL

Temporal Difference Learning

Método de aprendizaje por refuerzo que actualiza las estimaciones de valor utilizando la diferencia entre estimaciones sucesivas. En lugar de esperar a recibir una recompensa final, el algoritmo actualiza continuamente sus estimaciones de valor basándose en la retroalimentación inmediata recibida del entorno. Este enfoque permite un aprendizaje más rápido y eficiente en entornos donde las recompensas son escasas o demoradas.
Fuente:

TN University. (2024). Diccionario sobre inteligencia artificial: 100 conceptos claves sobre sistemas inteligentes.

Ver documento completo >
Tal vez pueda interesarte:

Publicaciones

Monitor de recursos

Latindex

Esta base de datos incluye revistas de investigación científica, técnico-profesionales y de divulgación científica y cultural que se editan en América Latina, el Caribe, España

Archives of Public Health

Repositorio institucional de la Organización Panamericana de la Salud/Organización Mundial de Salud (OPS/OMS) que se ha consolidado como su biblioteca digital, ya que reúne los

Bibliografías especializadas

Ir al contenido