Hadoop

Pour concrétiser des projets data science d’envergure aujourd’hui, il est impératif d’utiliser des framework dédiés au Big Data. C’est la raison pour laquelle OpenStudio a fait le choix du logiciel open source Hadoop pour mener à bien certains de ses projets.

Qu’est-ce que le framework Hadoop ?

Framework open source, Hadoop est dédié au stockage et au traitement de très grands volumes de données. Son système de fichiers distribués (HDFS) permet l’exécution d’applications sur des systèmes en cluster, disposant d’un nombre important de noeuds.

logo Hadoop

Quels sont les avantages de Hadoop ?

Hadoop offre de nombreuses possibilités :

  • Une puissance et un temps de traitement rapide des données,
  • Une flexibilité visant à stocker n’importe quel type de données non structurées (textes, symboles, images, vidéos…),
  • L’opportunité de se confronter au Big Data pour un coût moindre car le logiciel est gratuit et libre d’accès,
  • Une élasticité en permettant de changer au sein d’un cluster le nombre de noeuds,

La capacité à préserver la disponibilité des données en les copiant automatiquement, et en plusieurs fois, sur divers noeuds d’un cluster.

Pourquoi OpenStudio privilégie le framework Hadoop ?

Faire le choix du framework Hadoop s’est révélé être pertinent pour OpenStudio dans le cadre de certains de nos projets nécessitant des capacités importantes de stockage et de traitement de données en constante évolution. De plus, cette solution assure la souveraineté de nos données de par son positionnement Open Source, et sa possibilité d’auto-hébergement. Logiciel mature et fiable, le logiciel Hadoop dispose aussi d’une importante communauté d’utilisateurs qui garantit la sécurité de son utilisation à court et moyen terme.