Master Big Data - Apache Spark/Hadoop/Sqoop/Hive/Flume
- الوصف
- أقسام الدرس
- رأي
In this course, you will start by learning what is hadoop distributed file system and most common hadoop commands required to work with Hadoop File system.
Then you will be introduced to Sqoop Import
-
Understand lifecycle of sqoop command.
-
Use sqoop import command to migrate data from Mysql to HDFS.
-
Use sqoop import command to migrate data from Mysql to Hive.
-
Use various file formats, compressions, file delimeter,where clause and queries while importing the data.
-
Understand split-by and boundary queries.
-
Use incremental mode to migrate the data from Mysql to HDFS.
Further, you will learn Sqoop Export to migrate data.
-
What is sqoop export
-
Using sqoop export, migrate data from HDFS to Mysql.
-
Using sqoop export, migrate data from Hive to Mysql.
Further, you will learn about Apache Flume
-
Understand Flume Architecture.
-
Using flume, Ingest data from Twitter and save to HDFS.
-
Using flume, Ingest data from netcat and save to HDFS.
-
Using flume, Ingest data from exec and show on console.
-
Describe flume interceptors and see examples of using interceptors.
-
Flume multiple agents
-
Flume Consolidation.
In the next section, we will learn about Apache Hive
-
Hive Intro
-
External & Managed Tables
-
Working with Different Files – Parquet,Avro
-
Compressions
-
Hive Analysis
-
Hive String Functions
-
Hive Date Functions
-
Partitioning
-
Bucketing
Finally You will learn about Apache Spark
-
Spark Intro
-
Cluster Overview
-
RDD
-
DAG/Stages/Tasks
-
Actions & Transformations
-
Transformation & Action Examples
-
Spark Data frames
-
Spark Data frames – working with diff File Formats & Compression
-
Dataframes API’s
-
Spark SQL
-
Dataframe Examples
-
Spark with Cassandra Integration
-
9Sqoop Introductionدرس فيديو
-
10Managing Target Directoriesدرس فيديو
-
11Working with Parquet File Formatدرس فيديو
-
12Working with Avro File Formatدرس فيديو
-
13Working with Different Compressionsدرس فيديو
-
14Conditional Importsدرس فيديو
-
15Split-by and Boundary Queriesدرس فيديو
-
16Field delimetersدرس فيديو
-
17Incremental Appendsدرس فيديو
-
18Sqoop-Hive Cluster Fixدرس نصي
-
19Sqoop Hive Importدرس فيديو
-
20Sqoop List Tables/Databaseدرس فيديو
-
21Sqoop Assignment1درس نصي
-
22Sqoop Assignment2درس نصي
-
23Sqoop Import Practice1درس فيديو
-
24Sqoop Import Practice2درس فيديو
-
29Flume Introduction & Architectureدرس فيديو
-
30Exec Source and Logger Sinkدرس فيديو
-
31Moving data from Twitter to HDFSدرس فيديو
-
32Moving data from NetCat to HDFSدرس فيديو
-
33Flume Interceptorsدرس فيديو
-
34Flume Interceptor Exampleدرس فيديو
-
35Flume Multi-Agent Flowدرس فيديو
-
36Flume Consolidationدرس فيديو
-
37Hive Introductionدرس فيديو
-
38Hive Databaseدرس فيديو
-
39Hive Managed Tablesدرس فيديو
-
40Hive External Tablesدرس فيديو
-
41Hive Insertsدرس فيديو
-
42Hive Analyticsدرس فيديو
-
43Working with Parquetدرس فيديو
-
44Compressing Parquetدرس فيديو
-
45Working with Fixed File Formatدرس فيديو
-
46Alter Commandدرس فيديو
-
47Hive String Functionsدرس فيديو
-
48Hive Date Functionsدرس فيديو
-
49Hive Partitioningدرس فيديو
-
50Hive Bucketingدرس فيديو
-
56Map/FlatMap Transformationدرس فيديو
-
57Filter/Intersectionدرس فيديو
-
58Union/Distinct Transformationدرس فيديو
-
59GroupByKey/ Group people based on Birthday monthsدرس فيديو
-
60ReduceByKey / Total Number of students in each Subjectدرس فيديو
-
61SortByKey / Sort students based on their rollnoدرس فيديو
-
62MapPartition / MapPartitionWithIndexدرس فيديو
-
63Change number of Partitionsدرس فيديو
-
64Join / join email address based on customer nameدرس فيديو
-
65Spark Actionsدرس فيديو
-
72Dataframe Introدرس فيديو
-
73Dafaframe from Json Filesدرس فيديو
-
74Dataframe from Parquet Filesدرس فيديو
-
75Dataframe from CSV Filesدرس فيديو
-
76Dataframe from Avro Fileدرس فيديو
-
77Working with XMLدرس فيديو
-
78Working with Columnsدرس فيديو
-
79Working with Stringدرس فيديو
-
80Working with Datesدرس فيديو
-
81Dataframe Filter APIدرس فيديو
-
82DataFrame API Part1درس فيديو
-
83DataFrame API Part2درس فيديو
-
84Spark SQLدرس فيديو
-
85Working with Hive Tables in Sparkدرس فيديو