Apache Hive

From air
Jump to navigation Jump to search
The printable version is no longer supported and may have rendering errors. Please update your browser bookmarks and please use the default browser print function instead.

Apache Hive http://hive.apache.org est un système de gestion d'entrepôts de données (datawarehouse). Il permet les opérations d'agrégation et l'analyse de grands ensembles de données stockées dans un système de fichiers compatible avec Apache Hadoop. La manipulation et l'interrogation des données sont exprimées en HiveQL, dont la syntaxte est semblable à SQL. Hive est extensible au moyen de mappers and reducers quand HiveQL n'est pas pratique ou preformant.