Nutch

Nutch
Description de l'image Apache Nutch logo.svg.
Description de l'image Nutch.png.
Informations
Développé par Doug Cutting
Première version [1]Voir et modifier les données sur Wikidata
Dernière version 1.20 ()[2]Voir et modifier les données sur Wikidata
Dépôt github.com/apache/nutch, gitbox.apache.org/repos/asf/nutch.git et github.com/apache/nutch.gitVoir et modifier les données sur Wikidata
Écrit en JavaVoir et modifier les données sur Wikidata
Système d'exploitation MultiplateformeVoir et modifier les données sur Wikidata
Environnement Windows, Mac OS X, GNU/Linux
Formats lus WARC (en)Voir et modifier les données sur Wikidata
Formats écrits WARC (en)Voir et modifier les données sur Wikidata
Type moteur de recherche open source
Licence Licence ApacheVoir et modifier les données sur Wikidata
Site web nutch.apache.orgVoir et modifier les données sur Wikidata

Nutch est une initiative visant à construire un moteur de recherche open source. Il utilise Lucene comme bibliothèque de moteur de recherche et d'indexation. En revanche, le robot de collecte a été créé spécifiquement pour ce projet.

L'architecture de Nutch est hautement modulaire et permet à des développeurs de créer des plugins pour différentes phases du processus : récupération des données, analyse des documents, recherche, etc.

Doug Cutting est l'initiateur et le coordinateur de ce projet.

Il est entièrement développé en langage Java, mais les données qu'il manipule sont dans un format de données indépendant de tout langage de programmation. En a été présenté une version opérationnelle d'une démonstration de Nutch sur une base regroupant 100 millions de documents.

  1. « https://projects.apache.org/json/projects/nutch.json » (consulté le )
  2. (en) Apache Nutch Project Management Committee, « Downloads » (consulté le )

From Wikipedia, the free encyclopedia · View on Wikipedia

Developed by Nelliwinne