Le Big Data : des zettaoctets de données à analyser pour en extraire de la valeur !!
Mais pour y arriver, il faut des experts et des technologies
Hadoop est la technologie phare depuis plusieurs années, ou plutôt un éco-système qui regroupe non seulement MapReduce, Yarn et HDFS mais aussi de manière plus vaste Spark, des bases NoSQL et des outils de traitements temps réel des données
Comment démarrer, comment progresser avec Hadoop ?
Avec cette formation, vos compétences s’améliorent chapitre après chapitre, les objectifs sont clairement définis
Je vous accompagne dès l’installation d’Hadoop sur votre PC ou Mac
Le concepts de base vous sont expliqués progressivement puis vous vous exercez immédiatement en suivant les vidéos de démonstration
Des quiz à chaque fin de chapitre vous permettent de valider vos connaissances, et les très nombreuses ressources fournies vous permettent d’aller plus loin sur l’outil de votre choix
La formation va vous permettre d’acquérir des compétences claires et très recherchées
Si vous souhaitez faire les 3h d’exercices, n’oubliez pas qu’Hadoop réclame une configuration PC/Mac avec 16Gb de RAM pour que cela soit confortable
N’hésitez pas à pratiquer régulièrement pour devenir un expert dans ces technologies
La formation met aussi l’accent sur le support des technologies Hadoop dans le cloud computing avec AWS et Azure
Bienvenue à la formation Hadoop
En ressources vous trouverez:
- Le rapport 2011 de McKinsey - Big Data : la nouvelle frontière pour l’innovation, la compétition et la productivité
- Le rapport 2015 de l'Institut Montaigne - Big Data et objets connectés
Les principes du Big Data
Hadoop : présentation générale
En ressources vous trouverez 2 documents sur la Virtual Box d'Oracle VM
En ressources vous trouverez des documents explicatifs sur Ambari
Le cœur d'Hadoop : HDFS, MapReduce et YARN
En ressources vous trouverez une documentation sur le design de HDFS
En ressources vous trouverez la liste des commandes HDFS
En ressources vous trouverez 2 documents complémentaires sur MapReduce
En ressources vous trouverez un document pour aller plus loin sur YARN
Les bases de données relationnelles et NoSQL avec Hadoop
En ressources vous trouverez le document d'origine sur les règles de Codd
En ressources vous trouverez des documents complémentaires sur Hive
En ressources vous trouverez le guide complet de MySQL v5
En ressources vous trouverez des documents complémentaires sur HBase
En ressources vous trouverez un guide détaillé de Cassandra
En ressources vous trouverez un document complémentaire sur MongoDB
Programmation avec Hadoop : Spark et Pig
En ressources vous trouverez un document de recherche sur Pig
En ressources vous trouverez 2 documents complémentaires sur Spark
Traitement des données en temps réel
En ressources vous trouverez une documentation de référence sur Kafka
En ressources vous trouverez le guide utilisateur de Flume
En ressources vous trouverez un document de recherche sur SparkStreaming
En ressources vous trouverez un document récapitulatif de Storm
En ressources vous trouverez 2 documents complémentaires pour Flink
La gestion d'Hadoop
En ressources vous trouverez un document de recherche sur YARN
En ressources vous trouverez un document de recherche sur Mesos et le 1er chapitre d'un livre dédié à Mesos
En ressources vous trouverez un document de recherche sur Tez
En ressources vous trouverez 3 documents complémentaires sur ZooKeeper
En ressources vous trouverez un guide résumé de Zeppelin
Hadoop dans le Cloud
En ressources vous trouverez la documentation complète de HDInsight
En ressources vous trouverez une documentation de référence sur EMR