JenisLatihan Kelas
DAFTAR

kursus pensijilan hadoop data besar

Kursus & Latihan Sijil Hadoop Big Data

Gambaran Keseluruhan

Penonton & Prasyarat

Garis Panduan Kursus

Jadual & Bayaran

Pensijilan

Tinjauan Kursus Persijilan Hadoop Besar Data

Ia adalah kursus latihan Hadoop Big Data yang komprehensif yang direka oleh pakar industri memandangkan keperluan kerja industri semasa untuk menyediakan pembelajaran mendalam mengenai data besar dan Modul Hadoop. Ini adalah kursus latihan pensijilan Big Data yang diiktiraf oleh industri yang merupakan gabungan dari kursus latihan dalam pemaju Hadoop, pentadbir Hadoop, ujian Hadoop, dan analisis. Ini Cloudera Latihan Hadoop akan menyediakan anda untuk membersihkan pensijilan data besar.

Objektif

  • Asas-asas asas Hadoop 2.7 dan YARN dan tulis aplikasi menggunakannya
  • Menyediakan nod Pseudo dan Multi node cluster di Amazon EC2
  • Master HDFS, MapReduce, Hive, Babi, Oozie, Sqoop, Flume, Zookeeper, HBase
  • Belajar Spark, Spark RDD, Graphx, aplikasi Spark MLlib menulis
  • Aktiviti pentadbiran Master Hadoop seperti pengelolaan, pemantauan, pentadbiran dan penyelesaian masalah
  • Mengkonfigurasi alat ETL seperti Pentaho / Talend untuk bekerja dengan MapReduce, Hive, Babi, dan sebagainya
  • Pemahaman terperinci mengenai analitik Big Data
  • Aplikasi ujian Hadoop menggunakan MR Unit dan alat automasi lain.
  • Bekerja dengan format data Avro
  • Mengamalkan projek kehidupan sebenar menggunakan Hadoop dan Apache Spark
  • Dilengkapi untuk membersihkan Sijil Hadoop Data Big.

Audience bertujuan

  • Pemaju Pengaturcara dan Pentadbir Sistem
  • Profesional bekerja yang berpengalaman, Pengurus projek
  • Pemaju Data Data Besar yang ingin belajar menegak lain seperti Ujian, Analitis, Pentadbiran
  • Profesional Mainframe, Arkitek & Profesional Ujian
  • Perisikan Perniagaan, Gudang Data dan Profesional Analisis
  • Graduan, pelajar yang tidak sabar-sabar untuk mempelajari teknologi Data Big terbaru boleh menggunakan latihan dalam talian Sijil Tinggi Hadoop Big Data ini

Prasyarat

  • Tiada prasyarat untuk mengambil latihan data Big ini dan menguasai Hadoop. Tetapi asas-asas UNIX, SQL dan java akan menjadi baik. Pada Intellipaat, kami menyediakan unix percuma dan kursus Java dengan latihan pensijilan Big Data kami untuk menyemarakkan kemahiran yang diperlukan supaya anda baik kepada anda jalan pembelajaran Hadoop.

Course Outline Duration: 2 Days

Pengenalan kepada Data Besar & Hadoop dan Ekosistemnya, Peta Mengurangkan dan HDFS

Apakah Data Besar, Dimana Hadoop sesuai, Hadoop Sistem Fail yang Diagihkan - Replikasi, Saiz Blok, Namenode Sekunder, Ketersediaan Tinggi, Memahami YARN - ResourceManager, NodeManager, Perbezaan antara 1.x dan 2.x

Pemasangan & persediaan Hadoop

Senibina Cluster Hadoop 2.x, Persekutuan dan Ketersediaan Tinggi, Persediaan Pengkelasan Pengeluaran Biasa, Mod Kelompok Hadoop, Perintah Shell Hadoop Biasa, Hadoop 2.x Configuration Files, Cloudera Single node cluster

Deep Dive di Mapreduce

Bagaimana Kerja Mapreduce, Cara Pengurangan Bagaimana, Bagaimana Pemandu berfungsi, Gabungan, Pemisah, Format Input, Format Output, Shuffle dan Sort, Menggabungkan Mapside, Mengurangkan Sambutan Side, MRUnit, Cache Distributed

Latihan makmal:

Bekerja dengan HDFS, Menulis Program WordCount, Menulis partition tersuai, Memadamkan dengan Combiner, Peta Sampingan Sertai, Mengurangkan Sambutan Side, Unit Pengujian Mapreduce, Running Mapreduce dalam Mod LocalJobRunner

Penyelesaian Masalah Graf

Apakah Grafik, Graf Perwakilan, Algoritma Carian terlebih dahulu, Grafik Perwakilan Peta Mengurangi, Bagaimana Grafik Algoritma Grafik, Contoh Grafik Peta Mengurangi,

    Latihan 1: Latihan 2: Latihan 3:

Pemahaman terperinci mengenai Babi

A. Pengenalan kepada Babi

Memahami Apache Pig, ciri-ciri, pelbagai kegunaan dan pembelajaran untuk berinteraksi dengan Babi

B. Menyebarkan Babi untuk analisis data

Sintaks Pig Latin, pelbagai definisi, jenis data dan penapis, jenis data, penyebaran Babi untuk ETL, pemuatan data, tontonan skema, definisi lapangan, fungsi yang biasa digunakan.

C. Babi untuk pemprosesan data yang kompleks

Pelbagai jenis data termasuk bersarang dan kompleks, data pemprosesan dengan Babi, lelaran data yang dikumpulkan, latihan praktikal

D. Performing multi-dataset operations

Menyediakan set data, pemisah data yang ditetapkan, pelbagai kaedah untuk menggabungkan set data, menetapkan operasi, senaman tangan

E. Mempanjangkan Babi

Memahami fungsi didefinisikan pengguna, melaksanakan pemprosesan data dengan bahasa lain, import dan makro, menggunakan aliran dan UDF untuk memperluaskan Babi, latihan praktikal

F. Pig Jobs

Bekerja dengan set data sebenar yang melibatkan Walmart dan Electronic Arts sebagai kajian kes

Pemahaman terperinci mengenai sarang

A. Pengenalan Hive

Memahami Sarang, perbandingan pangkalan data tradisi dengan perbandingan Hive, Babi dan Sarang, menyimpan data dalam skema Hive and Hive, Interaksi sarang dan pelbagai kes penggunaan Sarang

B. Sarang untuk analisis data hubungan

Memahami HiveQL, sintaks dasar, pelbagai jadual dan pangkalan data, jenis data, menyusun set data, pelbagai fungsi terbina dalam, menyebarkan pertanyaan Hive pada skrip, shell dan Hue.

C. Pengurusan data dengan Hive

Pelbagai pangkalan data, penciptaan pangkalan data, format data dalam Hive, pemodelan data, Tabel Hive-managed, Tabel kendiri kendiri, pemuatan data, menukar pangkalan data dan Tabel, penyederhanaan pertanyaan dengan Views, penyimpanan hasil pertanyaan, kawalan akses data, menguruskan data dengan Hive, Hive Metastore dan Thrift server.

D. Pengoptimuman sarang

Prestasi pembelajaran pertanyaan, mengindeks data, partitioning dan baldi

E. Memperluaskan sarang

Menyebarkan fungsi didefinisikan pengguna untuk memperluaskan Simpul

F. Hands on Exercises - bekerja dengan set data yang besar dan pertanyaan yang banyak

Menyebarkan sarang untuk jumlah data yang besar dan banyak pertanyaan

G. UDF, pengoptimuman pertanyaan

Bekerja secara meluas dengan Pertanyaan Ditetapkan Pengguna, belajar cara mengoptimumkan pertanyaan, pelbagai kaedah untuk melakukan penalaan prestasi.

Impala

A. Pengenalan kepada Impala

Apakah Impala ?, Bagaimana Impala Berbeza dari Sarang dan Babi, Bagaimana Impala Berbeza dari Pangkalan Data Relasi, Batasan dan Arah Masa Depan, Menggunakan Shell Impala

B. Memilih yang Terbaik (Sarang, Babi, Impala)

C. Pemodelan dan Pengurusan Data dengan Impala dan Hive

Tinjauan Penyimpanan Data, Membuat Pangkalan Data dan Jadual, Memuat Data ke dalam Jadual, HCatalog, Impala Metadata Caching

D. Pemisahan data

Gambaran Keseluruhan Pemisahan, Pemisahan di Impala dan Hive

(AVRO) Format Data

Memilih Format Fail, Sokongan Alat untuk Format Fail, Skema Avro, Menggunakan Avro dengan Hive dan Sqoop, Evro Schema Evolution, Mampatan

Pengenalan kepada seni bina Hbase

Apa itu Hbase, Di mana ia sesuai, Apa itu NOSQL

Apache Spark

A. Mengapa Spark? Bekerja dengan Spark dan Hadoop Sistem Fail yang Diagihkan

Apakah Spark, Perbandingan antara Spark dan Hadoop, Komponen Spark

B. Spark Components, Algoritma Spark Biasa-Algoritma Iteratif, Analisis Grafik, Pembelajaran Mesin

Apache Spark- Pengenalan, Konsistensi, Ketersediaan, Pemisahan, Sparking Unified Stack, Komponen Spark, Contoh mengomel, mahout, ribut, graf

C. Running Spark pada Cluster, Menulis Aplikasi Spark menggunakan Python, Java, Scala

Terangkan contoh python, Tunjukkan pemasangan percikan, Terangkan program pemandu, Menjelaskan konteks spark dengan contoh, Tentukan pembolehubah yang ditaip yang lemah, Gabungkan scala dan java lancar, Terangkan keseragaman dan pengedaran., Terangkan apakah ciri, Terangkan fungsi pesanan yang lebih tinggi dengan contoh, Tentukan OFI penjadual, Kelebihan Spark, Contoh Lamda menggunakan percikan api, Jelaskan Mapreduce dengan contoh

Persediaan Kluster Hadoop dan Peta Berlari Mengurangkan Pekerjaan

Persediaan Kluster Multi Node menggunakan Amazon ec2 - Membuat persediaan kelompok nod 4, Running Map Mengurangkan Pekerjaan pada Kluster

Projek Utama - Meletakkannya bersama-sama dan Menyambung Titik

Meletakkannya bersama-sama dan Menyambung Titik, Bekerja dengan set data yang besar, Langkah-langkah yang terlibat dalam menganalisis data besar

Kesambungan ETL dengan Ekosistem Hadoop

Bagaimana alat ETL berfungsi dalam Industri data Big, Menyambung ke HDFS dari alat ETL dan mengalihkan data dari Sistem setempat ke HDFS, Pindah Data dari DBMS ke HDFS, Bekerja dengan Hive dengan Alat ETL, Membuat Peta Mengurangkan kerja dalam alat ETL, Berakhir hingga Akhir ETL PoC menunjukkan integrasi data yang besar dengan alat ETL.

Konfigurasi Kluster

Gambaran keseluruhan konfigurasi dan fail konfigurasi penting, Parameter dan nilai konfigurasi, parameter HDFS MapReduce parameter, persekitaran persekitaran Hadoop, 'Termasuk' dan 'Tidak termasuk' fail konfigurasi, Lab: MapReduce Performance Tuning

Pentadbiran dan Penyelenggaraan

Struktur dan fail direktori Namenode / Datanode, Imej sistem fail dan Edit log, Prosedur Pemeriksaan, Kegagalan Namenode dan prosedur pemulihan, Mod Selamat, Metadata dan sandaran Data, Masalah dan penyelesaian berpotensi / apa yang perlu dicari, Menambah dan membuang nod, Makmal: MapReduce Pemulihan sistem fail

Pemantauan dan Penyelesaian Masalah

Amalan terbaik memantau kumpulan, Menggunakan log dan jejak tindanan untuk pemantauan dan penyelesaian masalah, Menggunakan alat sumber terbuka untuk memantau kumpulan

Job Scheduler: Peta mengurangkan aliran penyerahan kerja

Bagaimana untuk menjadualkan Pekerjaan pada kelompok yang sama, Jadual FIFO, Penjadual Cukup dan konfigurasinya

Persediaan Kluster Multi Node dan Peta Berlari Mengurangkan Pekerjaan di Amazon Ec2

Persediaan Kluster Multi Node menggunakan Amazon ec2 - Membuat persediaan kelompok nod 4, Running Map Mengurangkan Pekerjaan pada Kluster

PENJAGA ZOO

ZOOKEEPER Pengenalan, ZOOKEEPER menggunakan kes, ZOOKEEPER Services, Model data ZOOKEEPER, Znodes dan jenisnya, Operasi Znodes, jam tangan Znodes, Znodes membaca dan menulis, Jaminan Konsisten, Pengurusan Kluster, Pemilihan Pemimpin, Pengedaran Eksklusif, Mata Penting

Advance Oozie

Kenapa Oozie ?, Memasang Oozie, Menjalankan contoh, enjin Oozie- alur kerja, Contoh M / R tindakan, Contoh contoh kata, Aplikasi aliran kerja, Penyerahan aliran kerja, Peralihan kerja aliran negara, pemprosesan kerja Oozie, Keselamatan Oozie, Mengapa keselamatan Oozie? , Pelbagai penyewaan dan skalabilitas, Talian masa kerja Oozie, Penyelaras, Bundel, Lapisan abstraksi, Senibina, Penggunaan Kes 1: pencetus masa, Gunakan Kes 2: data dan pencetus masa, Gunakan Kes 3: tetingkap rolling

Advance Flume

Tinjauan Apache Flume, sumber data yang diedarkan secara fizikal, menukar struktur data, melihat lebih dekat, Anatomi Flume, konsep teras, acara, pelanggan, ejen, sumber, saluran, sink, penyekat, pemilih saluran, pemproses sink, data ingest, saluran paip ejen , Pertukaran data Transaksional, Routing dan replicating, Mengapa saluran ?, Gunakan case-Log pengagregatan, Menambah ejen flume, Mengendalikan ladang server, Jumlah data per ejen, Contoh menggambarkan penyebaran nodus tunggal nod

Advance HUE

, Pengenalan HUE, ekosistem HUE, Apa yang HUE ?, HUE pandangan dunia sebenar, Kelebihan HUE, Bagaimana untuk memuat naik data dalam Pelayar Fail ?, Lihat kandungan, Mengintegrasikan pengguna, Mengintegrasikan HDFS, Asas Hue FRONTEND

Advance Impala

IMPALA Gambaran keseluruhan: Matlamat, pandangan pengguna Impala: Ikhtisar, Paparan pengguna Impala: SQL, Paparan pengguna Impala: Apache HBase, Impala seni bina, Impala negeri kedai, Perkhidmatan Katalog impala, Fasa pelaksanaan pertanyaan,

Ujian Permohonan Hadoop

Mengapa pengujian adalah penting, Ujian Unit, Ujian Integrasi, Ujian Prestasi, Diagnostik, Ujian QA Malam, Ujian Penanda Aras dan Ujian Akhir, Ujian Fungsional, Ujian Sijil Keluaran, Ujian Keselamatan, Ujian Skalabilitas, Pentauliahan dan Penolakan Data Nod Ujian, Ujian Kebolehpercayaan , Ujian pelepas

Peranan dan Tanggungjawab Profesional Pengujian Hadoop

Memahami Keperluan, penyediaan Anggaran Pengujian, Kes Ujian, Data Ujian, Penciptaan katil ujian, Pelaksanaan Ujian, Laporan Kekurangan, Retest Retest, Penyerahan Laporan Status Harian, Penyempurnaan ujian, ujian ETL pada setiap tahap (HDFS, HIVE, HBASE). memuatkan input (log / fail / rekod dan sebagainya) menggunakan sqoop / flume yang termasuk tetapi tidak terhad kepada pengesahan data, Rekonsiliasi, Pengesahan Pengguna dan pengesahan Pengesahan (Kumpulan, Pengguna, Keistimewaan dll), Laporkan kecacatan kepada pasukan pembangunan atau pengurus dan memandu mereka ditutup, Menyatupadukan semua kecacatan dan membuat laporan kecacatan, Mengesahkan ciri dan isu baru di Core Hadoop.

Rangka kerja yang dipanggil Unit MR untuk Menguji Program Mengurangkan Peta

Laporkan kecacatan kepada pasukan pembangunan atau pengurus dan memandu mereka ke penutupan, Menggabungkan semua kecacatan dan membuat laporan kecacatan, Bertanggungjawab untuk mewujudkan Rangka Kerja ujian yang dipanggil Unit MR untuk menguji Peta-Mengurangkan program.

Ujian Unit

Ujian automasi menggunakan OOZIE, Pengesahan data menggunakan alat lonjakan pertanyaan.

Ujian Pelaksanaan

Pelan ujian untuk peningkatan HDFS, Ujian automasi dan keputusan

Strategi Pelan Ujian dan penulisan Ujian Kes untuk ujian Permohonan Hadoop

Bagaimana untuk menguji memasang dan mengkonfigurasi

Sokongan Kerja dan Sijil

Petua Persijilan Cloudera dan Bimbingan dan Penyediaan Temuduga Mock, Tips dan Teknik Pembangunan Praktikal

Sila tulis kepada kami di info@itstechschool.com & hubungi kami di + 91-9870480053 untuk harga kursus & kos persijilan, jadual & lokasi

Drop Kami Pertanyaan

Kursus latihan ini direka untuk membantu anda membersihkan kedua-duanya Cloudera Spark dan Hadoop Developer Certification (CCA175) peperiksaan dan Pentadbir Bersertifikat Cloudera untuk Apache Hadoop (CCAH) peperiksaan. Seluruh kandungan kursus latihan selaras dengan kedua-dua program pensijilan ini dan membantu anda membersihkan peperiksaan pensijilan dengan mudah dan mendapatkan pekerjaan terbaik di MNC teratas.

Sebagai sebahagian daripada latihan ini, anda akan bekerja pada projek masa nyata dan tugasan yang mempunyai implikasi yang sangat besar dalam senario industri dunia sebenar yang membantu anda mengejar kerjaya anda dengan mudah.

Pada akhir program latihan ini akan ada kuiz yang mencerminkan jenis soalan yang diminta dalam peperiksaan pensijilan dan membantu anda menjaringkan markah yang lebih baik dalam peperiksaan pensijilan.

Sijil Penyelesaian Kursus ITS akan diberikan apabila selesai kerja Projek (pada ulasan pakar) dan setelah mencetak sekurang-kurangnya 60% dalam kuiz. Persijilan Intellipaat diiktiraf di 80 + MNC seperti Ericsson, Cisco, Cognizant, Sony, Mu Sigma, Saint-Gobain, Standard Chartered, TCS, Genpact, Hexaware, dan sebagainya.

Untuk maklumat lanjut, sila hubungi kami Hubungi Kami.


ulasan