GLOSARIO DE SEGURIDAD SOCIAL

Temporal Difference Learning

Método de aprendizaje por refuerzo que actualiza las estimaciones de valor utilizando la diferencia entre estimaciones sucesivas. En lugar de esperar a recibir una recompensa final, el algoritmo actualiza continuamente sus estimaciones de valor basándose en la retroalimentación inmediata recibida del entorno. Este enfoque permite un aprendizaje más rápido y eficiente en entornos donde las recompensas son escasas o demoradas.
Fuente:

TN University. (2024). Diccionario sobre inteligencia artificial: 100 conceptos claves sobre sistemas inteligentes.

Ver documento completo >
Tal vez pueda interesarte:

Publicaciones

La seguridad social en Canadá

La presente monografía describe la situación de salud y seguridad social en Canadá, detalla los diez programas de seguridad social existentes en el país, proporciona un marco general sobre las

Monitor de recursos

Dialnet

Tiene su origen en la Biblioteca y el Servicio Informático de la Universidad de La Rioja y su objetivo inicial fue emitir alertas informativas a

Bibliografías especializadas

Ir al contenido