GLOSARIO DE SEGURIDAD SOCIAL

Temporal Difference Learning

Método de aprendizaje por refuerzo que actualiza las estimaciones de valor utilizando la diferencia entre estimaciones sucesivas. En lugar de esperar a recibir una recompensa final, el algoritmo actualiza continuamente sus estimaciones de valor basándose en la retroalimentación inmediata recibida del entorno. Este enfoque permite un aprendizaje más rápido y eficiente en entornos donde las recompensas son escasas o demoradas.
Fuente:

TN University. (2024). Diccionario sobre inteligencia artificial: 100 conceptos claves sobre sistemas inteligentes.

Ver documento completo >
Tal vez pueda interesarte:

Publicaciones

La seguridad social como sistema

El desarrollo de la tecnología, la ciencia y el crecimiento demográfico han producido una civilización con esquemas de comportamiento muy complejos. En la actualidad, la multitud de estructuras existentes, llenas

Monitor de recursos

PuBMed

Motor de búsqueda de acceso libre que permite la consulta de los contenidos de la base de datos MEDLINE, especializada en áreas de medicina, enfermería,

Bibliografías especializadas

Ir al contenido