Técnica utilizada para reducir la precisión de los números en modelos de aprendizaje automático. Esto se logra mediante la representación de números con menos bits de precisión, lo que reduce el tamaño del modelo y la cantidad de recursos computacionales necesarios para su ejecución. La cuantificación puede mejorar la eficiencia y la velocidad de los modelos, especialmente en dispositivos con recursos limitados como dispositivos móviles o sistemas embebidos.