Marco de software de código abierto utilizado para el procesamiento y almacenamiento distribuido de grandes conjuntos de datos en clústeres de computadoras. Proporciona una plataforma para el procesamiento paralelo de datos a través de su sistema de archivos distribuido (HDFS) y el marco de procesamiento distribuido MapReduce. Hadoop es ampliamente utilizado en aplicaciones de big data y análisis de datos a gran escala.