Le guide complet d'Hadoop 2021 : maîtriser le Big Data
- Objectifs pédagogiques
- Sections du cours
- Avis
Le Big Data : des zettaoctets de données à analyser pour en extraire de la valeur !!
Mais pour y arriver, il faut des experts et des technologies
Hadoop est la technologie phare depuis plusieurs années, ou plutôt un éco-système qui regroupe non seulement MapReduce, Yarn et HDFS mais aussi de manière plus vaste Spark, des bases NoSQL et des outils de traitements temps réel des données
Comment démarrer, comment progresser avec Hadoop ?
Avec cette formation, vos compétences s’améliorent chapitre après chapitre, les objectifs sont clairement définis
Je vous accompagne dès l’installation d’Hadoop sur votre PC ou Mac
Le concepts de base vous sont expliqués progressivement puis vous vous exercez immédiatement en suivant les vidéos de démonstration
Des quiz à chaque fin de chapitre vous permettent de valider vos connaissances, et les très nombreuses ressources fournies vous permettent d’aller plus loin sur l’outil de votre choix
La formation va vous permettre d’acquérir des compétences claires et très recherchées
Si vous souhaitez faire les 3h d’exercices, n’oubliez pas qu’Hadoop réclame une configuration PC/Mac avec 16Gb de RAM pour que cela soit confortable
N’hésitez pas à pratiquer régulièrement pour devenir un expert dans ces technologies
La formation met aussi l’accent sur le support des technologies Hadoop dans le cloud computing avec AWS et Azure
-
1Bienvenue dans le Big Data avec HadoopLeçon vidéo
En ressources vous trouverez:
- Le rapport 2011 de McKinsey - Big Data : la nouvelle frontière pour l’innovation, la compétition et la productivité
- Le rapport 2015 de l'Institut Montaigne - Big Data et objets connectés
-
2Quiz de départ : choisissez la meilleure réponseQuiz
-
3La roue des compétencesLeçon vidéo
-
4Compétence 1 : j'ai saisi la plus value du Big DataLeçon vidéo
-
5Aux origines du Big DataLeçon vidéo
-
6Enjeux et défis du Big DataLeçon vidéo
-
7Exercice pratiqueLeçon de texte
-
8Applications concrètes du Big DataLeçon vidéo
-
9Technologies mises en jeu : comment s'y retrouverLeçon vidéo
-
10Quiz : choisissez la meilleure réponseQuiz
-
11Compétence 2 : je peux expliquer ce qu'est HadoopLeçon vidéo
-
12A la rencontre d'HadoopLeçon vidéo
-
13L'écosystème Hadoop : un foisonnement de logicielsLeçon vidéo
-
14Que peut-on faire avec Hadoop ?Leçon vidéo
-
15Comment se procurer Hadoop ?Leçon vidéo
-
16PRATIQUE - Une installation d'Hadoop avec Oracle VMLeçon vidéo
En ressources vous trouverez 2 documents sur la Virtual Box d'Oracle VM
-
17L'administration graphique d'Hadoop avec AmbariLeçon vidéo
En ressources vous trouverez des documents explicatifs sur Ambari
-
18PRATIQUE - AmbariLeçon vidéo
-
19Quiz : choisissez la meilleure réponseQuiz
-
20Compétence 3 : je comprends le fonctionnement interne d'HadoopLeçon vidéo
-
21HDFS : le système de gestion distribué des fichiers HadoopLeçon vidéo
En ressources vous trouverez une documentation sur le design de HDFS
-
22PRATIQUE - Charger des fichiers dans HDFSLeçon vidéo
En ressources vous trouverez la liste des commandes HDFS
-
23MapReduce : pour traiter en parallèle les volumes importants de donnéesLeçon vidéo
En ressources vous trouverez 2 documents complémentaires sur MapReduce
-
24PRATIQUE MapReduce - Compter le nombre de naissances par prénomLeçon vidéo
-
25YARN : la planification des traitements et la gestion des ressources d'HadoopLeçon vidéo
En ressources vous trouverez un document pour aller plus loin sur YARN
-
26PRATIQUE - YARNLeçon vidéo
-
27Quiz : choisissez la meilleure réponseQuiz
-
28Compétence 4 : je sais choisir quelle base de données utiliser avec HadoopLeçon vidéo
-
29Comment sont vos données ? Structurées ou non ?Leçon vidéo
En ressources vous trouverez le document d'origine sur les règles de Codd
-
30Hive : entrepôt de donnéesLeçon vidéo
En ressources vous trouverez des documents complémentaires sur Hive
-
31PRATIQUE : HiveLeçon vidéo
-
32MySQL : base de données relationnelleLeçon vidéo
En ressources vous trouverez le guide complet de MySQL v5
-
33PRATIQUE : MySQLLeçon vidéo
-
34Sqoop : transférer les données relationnelles avec HadoopLeçon vidéo
-
35PRATIQUE : SqoopLeçon vidéo
-
36Le NoSQL : cas d'usagesLeçon vidéo
-
37HBase : base de données non relationnelle et distribuéeLeçon vidéo
En ressources vous trouverez des documents complémentaires sur HBase
-
38PRATIQUE - HBaseLeçon vidéo
-
39Cassandra : aucun point de défaillance possibleLeçon vidéo
En ressources vous trouverez un guide détaillé de Cassandra
-
40PRATIQUE - CassandraLeçon vidéo
-
41MongoDB : la base de données orientée documentLeçon vidéo
En ressources vous trouverez un document complémentaire sur MongoDB
-
42PRATIQUE - MongoDBLeçon vidéo
-
43Quiz : choisissez la meilleure réponseQuiz
-
44Compétence 5 : j'ai une connaissance générale du fonctionnement de la programmatLeçon vidéo
-
45Pig : créer vos programmes MapReduceLeçon vidéo
En ressources vous trouverez un document de recherche sur Pig
-
46PRATIQUE - PigLeçon vidéo
-
47Spark : le logiciel phare d'HadoopLeçon vidéo
En ressources vous trouverez 2 documents complémentaires sur Spark
-
48Quiz : choisissez la meilleure réponseQuiz
-
49Compétence 6 : je comprends la force d'Hadoop dans le traitement temps réelLeçon vidéo
-
50Hadoop et les données en temps réelLeçon vidéo
-
51Kafka : manipuler les flux de donnéesLeçon vidéo
En ressources vous trouverez une documentation de référence sur Kafka
-
52PRATIQUE - KafkaLeçon vidéo
-
53Flume : pour agréger en temps réel les logs de vos serveurs WebLeçon vidéo
En ressources vous trouverez le guide utilisateur de Flume
-
54SparkStreaming : pour valoriser vos données en temps réelLeçon vidéo
En ressources vous trouverez un document de recherche sur SparkStreaming
-
55PRATIQUE - SparkStreamingLeçon vidéo
-
56Storm : les événements en temps réelLeçon vidéo
En ressources vous trouverez un document récapitulatif de Storm
-
57Flink : traitement distribué en pipelineLeçon vidéo
En ressources vous trouverez 2 documents complémentaires pour Flink
-
58Comparaison SparkStreaming, Storm et FlinkLeçon vidéo
-
59Quiz : choisissez la meilleure réponseQuiz
-
60Compétence 7 : je sais à quoi servent les principaux outils de gestion d'HadoopLeçon vidéo
-
61Pourquoi autant d'outils différents ?Leçon vidéo
-
62YARN en détailLeçon vidéo
En ressources vous trouverez un document de recherche sur YARN
-
63Mesos : la gestion de clustersLeçon vidéo
En ressources vous trouverez un document de recherche sur Mesos et le 1er chapitre d'un livre dédié à Mesos
-
64Tez : pour remplacer MapReduceLeçon vidéo
En ressources vous trouverez un document de recherche sur Tez
-
65PRATIQUE - TezLeçon vidéo
-
66Oozie : planifier les jobs HadoopLeçon vidéo
-
67Zookeeper : pour gérer les configurationsLeçon vidéo
En ressources vous trouverez 3 documents complémentaires sur ZooKeeper
-
68Zeppelin : mettre en forme et visualiser vos donnéesLeçon vidéo
En ressources vous trouverez un guide résumé de Zeppelin
-
69PRATIQUE - ZeppelinLeçon vidéo
-
70Quiz : choisissez la meilleure réponseQuiz
-
71Compétence 8 : je peux recommander d'utiliser le Cloud pour faire de l'HadoopLeçon vidéo
-
72Pourquoi aller vers le Cloud ?Leçon vidéo
-
73L'offre HDInsight de Microsoft AzureLeçon vidéo
En ressources vous trouverez la documentation complète de HDInsight
-
74PRATIQUE - HDInsightLeçon vidéo
-
75L'offre AWSLeçon vidéo
En ressources vous trouverez une documentation de référence sur EMR
-
76PRATIQUE - AWSLeçon vidéo
-
77L'offre de GoogleLeçon vidéo
-
78PRATIQUE - GoogleLeçon vidéo
-
79Quiz : choisissez la meilleure réponseQuiz