Apache Hive

Apache Hive http://hive.apache.org est un système de gestion d'entrepôts de données (datawarehouse). Il permet les opérations d'agrégation et l'analyse de grands ensembles de données stockées dans un système de fichiers compatible avec Apache Hadoop. La manipulation et l'interrogation des données sont exprimées en HiveQL, dont la syntaxte est semblable à SQL. Hive est extensible au moyen de mappers and reducers quand HiveQL n'est pas pratique ou preformant.