shriftSinf ta'limi
ro'yxatdan o'tish

Aloqa

Bilan belgilangan maydonlar * talab qilinadi

 

katta ma'lumotlar hadoop sertifikatlash kursi

Big Data Hadoop sertifikatlash kursi va treningi

haqida umumiy ma'lumot

Tomoshabin va old shartlar

Kursning tasviri

Dastur va tariflar

tasdiqlash

Katta Ma'lumotlarni Xadoop Sertifikatlash Kursi Umumiy Tasavvur

Katta ma'lumotlarga va Hadoop Modullariga chuqur o'rganishni ta'minlash uchun mavjud sanoat ishi talablarini inobatga olgan holda sanoat mutaxassislari tomonidan ishlab chiqilgan keng qamrovli Hadoop Big Data trening kursidir. Bu Hadoop ishlab chiquvchilari, Hadoop ma'murlari, Hadoop testlari va tahlillari bo'yicha trening kurslarining birlashmasi bo'lgan Big Data sertifikatlash kursini tan olgan sanoatdir. Bu Cloudera Hadoop treningi sizni katta ma'lumotni sertifikatlashni tozalashga tayyorlaydi.

Maqsadlar

  • Hadoop 2.7 va YARN magistrlik asoslari va ulardan foydalanib ularni yozish
  • Amazon EC2da Pseudo tugunni va ko'p tugunli klasterlarni sozlash
  • Master HDFS, MapReduce, Hive, Pig, Oozie, Sqoop, Flume, Zookeeper, HBase
  • Spark, Spark RDD, Graphx, MLlib yozishni Spark dasturlarini o'rganing
  • Klasterlarni boshqarish, monitoring, boshqarish va muammolarni bartaraf etish kabi Master Hadoop ma'muriyati faoliyati
  • MapReduce, Hive, Pig va boshqalar bilan ishlash uchun Pentaho / Talent kabi ETL asboblarini sozlash
  • Big Data analitikasining batafsil tushunchasi
  • MR birligi va boshqa avtomatizatsiya vositalari yordamida Hadoop sinov dasturlari.
  • Avro ma'lumot formatlari bilan ishlash
  • Hadoop va Apache Spark-dan foydalanib haqiqiy hayotiy loyihalarni amalda qo'llang
  • Big Data Hadoop sertifikatini tozalash uchun jihozlangan bo'ling.

mo'ljallangan auditoriya

  • Ishlab chiquvchilar va tizim boshqaruvchilari
  • Tajribali ishlaydigan mutaxassislar, loyiha menejerlari
  • Big DataHadoop Ishlab chiquvchilari Test, Analytics, Administration kabi boshqa vertikallarni o'rganishni xohlashadi
  • Mainframe mutaxassislari, mimarlar va test mutaxassislari
  • Ish zakovati, ma'lumotlar ombori va tahlilchilar mutaxassislari
  • Bitiruvchilar, eng yangi Big Data texnologiyasini o'rganishga intilayotgan talabalar ushbu Big Data Hadoop Sertifikatlash onlayn treningini olishlari mumkin

Talablar

  • Ushbu Katta ma'lumotni o'qitish va Hadoopni o'rganish uchun oldindan shart emas. Biroq, UNIX, SQL va java asoslari yaxshi bo'ladi. Intellipaat, biz sizga katta ma'lumotni sertifikatlash bo'yicha mashq qilishimiz bilan bepul unix va Java mashg'ulotini taqdim etamiz.

Kursning asosiy vaqti: 2 kun

Big Data & Hadoop va uning ekotizimiga kirish, Map kamaytirish va HDFS

Hadoop tarqalgan fayl tizimi - Replikatsiyalar, blokirovka kattaligi, ikkilamchi namenod, yuqori darajadagi mavjudligi, YARN - ResourceManager, NodeManager, 1.x va 2.x o'rtasidagi farqni aniqlash Big Data nima?

Hadoop O'rnatish va sozlash

Hadoop 2.x Klaster me'morchiligi, federatsiya va yuqori mavjudlik, odatiy ishlab chiqarish majmui sozlamalari, Hadoop klaster rejimi, umumiy Hadoop Shell komandalari, Hadoop 2.x konfiguratsion fayllari, Cloudera yagona tugunli klaster

Mapreduce-da chuqur sho'ng'in

Qanday ishlaydi, qanday ishlaydi, qanday ishlaydi, qanday qilib ishlaydi? Kombinatorlar, Partitioners, Input Formats, Output Formats, Shuffle and Sort, Mapside qo'shiladi, Side qo'shilishni qisqartirish, MRUnit, tarqalgan kesh

Laboratoriya mashqlari:

HDFS bilan ishlash, WordCount dasturini yozish, maxsus partitioner yozish, Kombinator bilan Mapreduce, Map Side Join, Yan qo'shilishni kamaytirish, birlikni sinash Mapreduce, LocalJobRunner rejimida Mapreduce

Grafik muammolarini echish

Grafika, grafikani taqdim etish, birinchi navbatda qidirish algoritmi, Xarita qisqartirishning grafik taqsimoti, Grafik algoritmini qanday bajarish, Grafika xaritasini qisqartirish misoli,

    Mashq qilish 1: Mashq qilish 2: Mashq qilish 3:

To'ng'izni batafsil tushunish

A. cho'chqa kirish

Apache cho'chqini tushunish, funktsiyalar, turli foydalanish va cho'chqa bilan muloqot qilishni o'rganish

B. Ma'lumotlarni tahlil qilish uchun cho'chqa tarqatish

Pig lotinining sintaksisi, turli xil ta'riflar, ma'lumotlar turi va filtrlari, ma'lumotlar turlari, ETL uchun cho'chqani tarqatish, ma'lumotlarni yuklash, sxema tomosha qilish, maydonning ta'riflari, keng tarqalgan foydalaniladigan funksiyalar.

Kompleks ma'lumotlarni qayta ishlash uchun cho'chqa

Turli xil ma'lumotlar turlari, jumladan, ichki va murakkab, cho'chqa bilan ishlov beruvchi ma'lumotlar, guruhlangan ma'lumotlar yineligi, amaliy mashqlar

D. ko'p datasetli operatsiyalarni bajarish

Ma'lumotlarni to'plash, ma'lumotni taqsimlash, ma'lumotlarni to'plash uchun turli xil usullarni o'rnatish, operatsiyalarni o'rnatish, qo'llash mashqlari

E. cho'chqani kengaytirish

Foydalanuvchilar tomonidan belgilangan funktsiyalarni tushunish, boshqa tillar bilan ishlashni amalga oshirish, import va makrolarni ishlatish, oqim va UDFlarni cho'chqani kengaytirish uchun ishlatish, amaliy mashq

F. Pig ishi

Walmart va Electronic Arts kompaniyasini real ma'lumot to'plamlari bilan ishlash

Hiveni batafsil tushunish

A. Hive Kirish

Hive, Hive, Pig va Hive taqqoslash an'anaviy ma'lumotlar bazasi taqqoslash, Hive va Hive sxemasi, Hive shovqinni va Hive turli xil foydalanish holatlarida ma'lumotlarni saqlash

B. Ratsional ma'lumotlarni tahlil qilish uchun kovlash

HiveQLni tushunish, asosiy sintaksisi, turli jadvallar va ma'lumotlar bazalari, ma'lumotlar turlari, ma'lumotlarni to'plash, turli o'rnatilgan funksiyalar, skriptlar, qobiq va ranglardagi Xiv so'rovlarini joylashtirish.

C. Xiv bilan ma'lumotlar boshqaruvi

Ma'lumotlar bazalarini yaratish, ma'lumotlar bazalarini yaratish, kovaklardagi ma'lumotlar formatlarini yaratish, ma'lumotni modellashtirish, kovaklar bilan boshqariladigan jadvallar, o'z-o'zidan boshqariladigan jadvallar, ma'lumotlarni yuklash, ma'lumotlar bazalari va jadvallarni o'zgartirish, ko'rishlar bilan so'rovlarni soddalashtirish, so'rovlarni natija saqlash, ma'lumotlarga kirishni boshqarish, ma'lumotlarni boshqarish Hive, Hive Metastore va Thrift serverlari bilan.

D. Hayvonni optimallashtirish

So'rovlar, ma'lumotlarni indekslash, partitioning va bucketing kabi narsalarni o'rganish

Xaytani kengaytirish

Hive-ni uzaytirish uchun foydalanuvchi belgilangan funktsiyalarni tarqatish

F. Qo'llar mashqlari - katta ma'lumotlar to'plamlari va keng qamrovli so'rovlar bilan ishlash

Katta miqdordagi ma'lumotlar to'plamlari va ko'p miqdorda so'rovlar uchun Hiveni joylashtirish

G. UDF, so'rovni optimallashtirish

So'rovlarni optimallashtirishni o'rganish, foydalanuvchi belgilaydigan so'rovlar bilan ishlash, ishlashni sozlashning turli usullari.

Impala

A. Impala kirish

Impala nima ?, Xiva va to'ng'izdan qanday farq qiladi, solishtirma ma'lumotlar bazalaridan qanday farq qiladi, cheklashlar va kelajakdagi yo'nalishlar, Impala Shell-dan foydalanish

B. eng yaxshi (qushqo'm, cho'chqa, impala)

Impala va Chive bilan ma'lumotlarni modellashtirish va boshqarish

Ma'lumotlar saqlash bo'yicha umumiy ma'lumotlar bazasi, ma'lumotlar bazalari va jadvallarni yaratish, jadvallardagi ma'lumotlarni yuklash, HCatalog, Impala metadata keshlash

D. Ma'lumotlarni ajratish

Impala va kovoqqa bo'linish

(AVRO) ma'lumot formatlari

Fayl formatini tanlash, fayl formatlari uchun vosita qo'llab-quvvatlash, evro sxemalari, kovanlar va Sqoop bilan avrodan foydalanish, evro sxemasi evolyutsiyasi, siqish

Hbase arxitekturasiga kirish

Hbase nima, U qaerga mos keladi, NOSQL nima?

Apache Spark

A. Nima uchun Spark? Spark va Hadoop tarqalgan fayl tizimi bilan ishlash

Spark nima, Spark va Hadoop o'rtasidagi solishtirish, Sparkning komponentlari

B. Spark komponentlari, umumiy uchqun algoritmlari - Iterativ algoritmlar, grafik tahlil qilish, mashinani o'rganish

Apache Spark - Kirish, izchillik, mavjudligi, bo'linishi, yagona Spektakl Spark, Spark komponentlari, Haydash namunasi, mahout, bo'ron, grafik

C. Sparkni bir guruhda ishga tushirish, Spark ilovalarini Python, Java, Scala yordamida yozish

Python misolini tavsiflab bering, haydovchi dasturini tushuntiring, misol bilan uchqun kontekstini tushuntirib bering, zaif harflar bilan kiritilgan o'zgaruvchini aniqlang, scala va java kombinatsiyasini aniqlang, parallellik va taqsimotni tushuntiring. Belgilangan xususiyatni tushuntiring, misol bilan yuqori tartib funktsiyasini tushuntiring. rejalashtiruvchi, Sparkning afzalliklari, uchqun yordamida Lamda misoli, misol bilan Mapreduce ni tushuntiring

Hadoop Klasterini O'rnatish va Ishga tushirish Map ishini qisqartirish

Amazon ek2 yordamida Multi Node Cluster Setup - 4 tugunni kümelenme sozlamalarini yaratish, Klaster ustida ishlarning xaritada qisqartirilishini qisqartirish

Katta loyiha - barchasini bir joyga to'plash va nuqtalarni ulash

Ularni bir joyga to'plash va Noktalarni ulash, Katta ma'lumotlar majmualari bilan ishlash, Katta ma'lumotlarni tahlil qilishda ishtirok etgan qadamlar

Hadoop ekotizimi bilan ETL aloqasi

ETL asboblari katta ma'lumotlar sanoatida qanday ishlaydi? ETL asbobidan HDFSga ulanish va mahalliy tizimdan HDFSga ma'lumotlarni ko'chirish, DBMS dan HDFSga o'tish, EVE asbobida Hive bilan ishlash, Map yaratish ETL vositasida ishni qisqartirish, ETLni tugatish ETL PoC ETL vositasi bilan katta ma'lumotlar integratsiyasini ko'rsatmoqda.

Klasterning konfiguratsiyasi

Konfiguratsiyaga umumiy nuqtai va muhim konfiguratsiya fayli, Konfiguratsiya parametrlari va qadriyatlari, HDFS parametrlari MapReduce parametrlari, Hadoop muhit sozlamalari, 'Qo'shish' va 'Darssiz' konfiguratsiya fayllari, Lab: MapReduce ishlash sozlamalari

Etakchi va Xizmat

Namenode / Datanode katalog tuzilmalari va fayllari, Fayl tizimi tasvirlari va tahrirlash jurnali, Checkpoint protsedurasi, Namenode xatosi va qutqaruv amaliyoti, Havfsiz rejim, Metadata va ma'lumotlar zaxirasi, Potentsial muammolar va yechimlar / nima qilish kerakligi, tugunlarni qo'shish va o'chirish, Laboratoriya: MapReduce Fayl tizimini tiklash

Monitoring va muammolarni bartaraf etish

Klasterni monitoring qilishning ilg'or tajribalari, Kuzatuv va muammolarni bartaraf etish uchun jurnallar va izlarni izlab ishlatish, Klasterni kuzatib borish uchun ochiq manbali vositalarni qo'llash

Ishni rejalashtiruvchi: Xarita ishni topshirish oqimini qisqartiradi

Ishlarni bir xil guruhlarda, FIFO dasturida, adolatli rejalashtiruvchi va uning konfiguratsiyasi bo'yicha qanday tartiblash mumkin

Amazon EcxNUMXda Multi Node Cluster O'rnatish va Map Running ishini qisqartirish

Amazon ek2 yordamida Multi Node Cluster Setup - 4 tugunni kümelenme sozlamalarini yaratish, Klaster ustida ishlarning xaritada qisqartirilishini qisqartirish

ZOOKEEPER

ZOOKEEPER kirish, ZOOKEEPER foydalanish holatlarida, ZOOKEEPER xizmatlari, ZOOKEEPER ma'lumot modeli, Znodes va turlari, Znodes operatsiyalari, Znodes soatlari, Znodes o'qiydi va yozadi, mustahkamlik kafolati, Klaster boshqarish, Etakchilik saylovlari, taqsimlansin Maxsus Qulf, Muhim ball

Advokat Oozie

Nimaga Oozie? Ni o'rnatish, Oozie ni o'rnatish, Misolni ishga tushirish, Oozie- ish oqimi qidiruvi, Misol M / R amaliyoti, So'zlar soni misoli, Ish oqimi ilovasi, Ish oqimini taqdim etish, Ish oqimining o'tishlari, Oozie ishlarini qayta ishlash, Oozie xavfsizligi, Nima uchun Oozie xavfsizligi? , Multi-tenancy va scalability, Oozie ishining vaqt chizig'i, Koordinator, Bundle, Abstraktsiya qatlami, Arxitektura, Foydalanish 1: vaqt tetikleyicilari, Foydalanish xodisalari 2: Ma'lumotlar va vaqt tetiklari, Foydalanish xodisalari 3:

Advance Flume

Apache Flume'ga umumiy nuqtai nazar, Jismoniy taqsimlangan ma'lumotlar manbalari, Ma'lumotlarni o'zgartirish tuzilmasi, Yaqinroq ko'rinishi, Flum anatomiyasi, Yadro tushunchalari, Voqealar, mijozlar, Agentlar, Resurs, Kanallar, Evyalar, Chiqaruvchilar, Kanalni tanlash, Sink protsessorlari , Transactional ma'lumotlar almashinuvi, Yonaltiruvchi va replikatsiya qilish, Kanallarni nima uchun ishlatish kerak ?, Axborotni ishlatish. Yig'ish agregati, Yaltiroq razryadini qo'shish, Server fermasini boshqarish, Agent bo'yicha ma'lumotlar hajmi.

Avvalgi HUE

HUE ekotizimi, HUE nima? HUE haqiqiy dunyo ko'rinishi, HUEning afzalliklari, Fayl brauzerida ma'lumotlarni qanday yuklash mumkin ?, Kontentni ko'rish, foydalanuvchilarni integratsiyalash, HDFSni integratsiya qilish, HUE FRONTEND asoslari

Advance Impala

IMPALA Umumiy Tasavvur: Maqsadlar, Impala Foydalanuvchi ko'rinishi: Umumiy Tasavvur, Impala Foydalanuvchi uchun foydalanuvchi ko'rinishi: SQL, Impala Foydalanuvchi uchun versiyasi: Apache HBase, Impala Architecture, Impala State Store, Impala katalog xizmati, So'rovni bajarish bosqichlari

Hadoop dastur sinovlari

Nimaga sinov muhimligi, Birlik testi, Integratsiyalashuv sinovlari, Ishlashni sinash, Diagnostika, Kechki QA sinovlari, Sinov va sinovdan so'ng yakuniy sinovlar, Funktsional testlar, Reliz sertifikatlash testlari, Xavfsizlikni testdan o'tkazish, Ölçeklenebilirlik sinovi, Ma'lumot nodalarini testdan o'tkazish va ishlatishni to'xtatish, Ishonchliligi testi , Chiqish sinovlari

Hadoop Testing Professionalining roli va mas'uliyati

Talabni tushunish, Testni baholash, Test ishi, Test ma'lumotlarini sinovdan o'tkazish, Testni bajarish, Xato hisobotini, Xatoni qayta sinov qilish, Kundalik vaziyat hisobotini yetkazib berish, Test yakunini, har bir bosqichda ETL testini (HDFS, HIVE, HBASE) tayyorlash. Ma'lumotlarni tekshirish, kelishuv, foydalanuvchi avtorizatsiyasi va autentifikatsiya testlarini (guruhlar, foydalanuvchilar, imtiyozlar va boshqalar) o'z ichiga olgan, lekin shular bilan cheklanmagan, sqoop / flume yordamida kirishni (loglar / fayllar / qaydlar va boshqalar) yuklash, ularni yopish, barcha nuqsonlarni birlashtirish va nuqsonli hisobotlarni yaratish, Core Hadoop'dagi yangi xususiyat va masalalarni tasdiqlash.

Map-kamaytirish dasturlarini sinovdan o'tkazish uchun MR birligi deb ataluvchi dastur

Rivojlanish guruhi yoki menejeriga nuqsonlarni xabar qilish va yopish uchun ularni haydash, Barcha kamchiliklarni birlashtiring va nuqsonli hisobotlarni tuzing, Map-Reduce dasturlarini sinab ko'rish uchun MR Unit deb nomlangan testni yaratish uchun mas'ul.

Birlik sinovi

OOZIE yordamida avtomatlashtirishni test qilish, so'rovlar kuchaytirgich vositasidan foydalanib, ma'lumotlarni aniqlash.

Sinovlarni ijro etish

HDFSni yangilash uchun sinov rejasi, viktorina otomasyon va natija

Tajriba rejasini tuzish va testdan o'tkazish uchun test sinovlari

O'rnatish va sozlashni sinash

Ish va sertifikatlashtirishni qo'llab-quvvatlash

Cloudera sertifikatlash bo'yicha tavsiyalar va rahbarlik va jirkanch intervyu tayyorlash, amaliyotni rivojlantirish bo'yicha maslahatlar va texnikalar

Iltimos, bizga yozing info@itstechschool.com Kurs bahosi va sertifikatlash narxi, jadval va joylashuvi uchun + 91-9870480053 da biz bilan bog'laning

Bizga so'rovni qoldiring

Ushbu trening mashg'ulotlari ikkalasini tozalashga yordam berish uchun mo'ljallangan Cloudera Spark va Hadoop Developer Certification (CCA175) sinov va Apache Hadoop (CCAH) uchun Cloudera sertifikati ma'muri imtihon. Barcha trening kurslari ushbu ikki sertifikatlash dasturiga mos keladi va ushbu sertifikatlashtirish imtihonlarini osonlik bilan tozalashga va yuqori darajali ko'p millatlarda eng yaxshi ishlarga ega bo'lishga yordam beradi.

Ushbu treningning bir qismi sifatida haqiqiy dunyo loyihalari va topshiriqlar ustida ishlashingiz mumkin, bu esa haqiqiy dunyo sanoatining senariyasida juda katta ta'sirga ega.

Ushbu o'quv dasturining oxirida sertifikatlashtirish imtihonlarida keltirilgan savollarning turini mukammal aks ettiradigan viktorina o'tkaziladi va sertifikatlashtirish imtihonida yaxshiroq baholarga ega bo'lishga yordam beradi.

ITS Kurs yakuni guvohnomasi loyiha ishi (ekspertizadan o'tish) va viktorinada kamida 60% markani belgilash bilan taqdirlanadi. Intellipaat sertifikati Ericsson, Cisco, Cognizant, Sony, Mu Sigma, Saint-Gobain, Standard Chartered, TCS, Genpact, Hexaware va boshqalar kabi yuqori 80 + ko'p millatli kompaniyalarda yaxshi tanilgan.

Qo'shimcha ma'lumot olish uchun Biz bilan bog'lanish.


Sharh