Apache Hadoop

Apache Hadoop
Kehittäjä Apache Software Foundation
Kehityshistoria
Vakaa versio 3.4.1 ()[1]
Tiedot
Alusta Alustariippumaton
Ohjelmointikielet Java
Lisenssi Apache 2
Aiheesta muualla
hadoop.apache.org
Versiohallinta

Hadoop on Apache Software Foundationin avoimen lähdekoodin ohjelmisto suurien hajautettujen tietomäärien käsittelyyn. Projekti on kehitetty ns. Big data prosessointiin.

Hadoop-järjestelmän komponentit ovat:

  • Hadoop Common (yhteisiä komponentteja)
  • Hadoop Distributed Filesystem (HDFS): hajautettu tiedostojärjestelmä
  • Hadoop MapReduce: tiedon prosessointi
  • Hadoop YARN: klusterin resurssien jakaminen ja ajoittaminen

Hadoopin MapReduce ja HDFS komponenttien konseptit perustuvat Googlen julkaisemiin papereihin Google MapReduce ja Google File System (GFS) komponenteista.[2][3]

  1. Release 3.4.1 available, (viitattu ). Tieto on haettu Wikidatasta.
  2. An introduction to Apache Hadoop for big data opensource.com. 26.8.2014. Viitattu 30.3.2018.
  3. Jim Scott: 5 Google Projects That Changed Big Data Forever mapr.com. 2.9.2014. Arkistoitu 11.6.2018. Viitattu 30.3.2018.

From Wikipedia, the free encyclopedia · View on Wikipedia

Developed by Nelliwinne