Apache Hadoop software | |
---|---|
![]() | |
Genere | Calcolo distribuito |
Sviluppatore | Apache Software Foundation |
Data prima versione | 1º aprile 2006 |
Ultima versione | 3.4.1 (18 ottobre 2024) |
Sistema operativo | Multipiattaforma |
Linguaggio | Java |
Licenza | Apache License 2.0 (licenza libera) |
Sito web | hadoop.apache.org |
Apache Hadoop è un framework sotto una licenza libera che supporta applicazioni distribuite con elevato accesso ai dati, permettendo alle applicazioni di lavorare con migliaia di nodi e petabyte di dati[1]. Ispirato dalla MapReduce di Google[2] e dal Google File System[3], è un progetto della fondazione Apache di alto livello costruito e usato da una comunità globale di contributori, che usano i linguaggi di programmazione Java e Scala.
Usato anche da AOL[4], Ebay[5], Facebook[6], IBM[7], Linkedin[8], Spotify[9], The New York Times[10] e Twitter[11], il più grande contributore a questo progetto è stato Yahoo![12], e ne fa fortemente uso[13]. Offre una grande quantità di librerie di semplice utilizzo ed ha per il momento tre versioni, la prima versione di Hadoop contiene Map Reduce e Hadoop Distributed File System (HDFS); dalla prima versione di Hadoop sono cambiate le necessità di prestazione, per questo motivo la seconda versione è stata quindi integrata con YARN[14].
Il nome del progetto è stato scelto dal suo creatore Doug Cutting, il quale ha scelto Hadoop, il nome dell'elefante di pezza di suo figlio[15]. In origine fu sviluppato per supportare la distribuzione per il progetto del motore di ricerca Nutch[16].