типОбука во училница
РЕГИСТАР

Контакт

Полињата означени со * се бара

 

големи податоци hadoop сертификација разбира

Големи податоци Hadoop сертификација на курсот и обука

Преглед

Публика и предуслови

Преглед на курсот

Распоред и такси

сертификација

Големи податоци Hadoop сертификација на курсот Преглед

Тоа е сеопфатен Hadoop Big Data курс, дизајниран од страна на експерти од индустријата, со оглед на моменталните барања за работа во индустријата за да се обезбеди детално учење за големи податоци и Hadoop модули. Ова е индустриски признаен курс за обука за сертификација на Биг податоци, кој е комбинација од курсеви за обука во Hadoop програмер, Hadoop администратор, Hadoop тестирање и анализатор. Ова Cloudera Обуката Hadoop ќе ве подготви да го исчистите големиот сертификат за податоци.

Цели

  • Магистерски основи на Hadoop 2.7 и YARN и пишувајте апликации кои ги користат
  • Поставување на Pseudo node и Мулти јазол кластер на Amazon EC2
  • Мајстор HDFS, MapReduce, кошница, свиња, ози, сквоп, флуме, чувар, HBase
  • Дознајте Искра, Искра RDD, Графикс, MLlib кои пишуваат Spark апликации
  • Мајстор Hadoop администрација активности како кластер за управување, следење, администрација и смена на проблеми
  • Конфигурирање на ETL алатки како Pentaho / Talend да работат со MapReduce, кошница, прасе, итн
  • Детално разбирање на анализата на Биг податоци
  • Hadoop тестирање на апликации со користење на MR единица и други алатки за автоматизација.
  • Работете со формати на податоци Avro
  • Вежбајте реални проекти со користење на Hadoop и Apache Spark
  • Бидете опремени за да го исчистите сертификатот за големи податоци Hadoop.

целната публика

  • Програмирање програмери и систем администратори
  • Искусни работници, проект менаџери
  • Биг DataHadoop програмери кои сакаат да научат други вертикали како Тестирање, Анализа, Администрација
  • Главните професионалци, архитекти и професионалци за тестирање
  • Бизнис разузнавање, складирање на податоци и аналитичари
  • Дипломирани студенти, студенти кои сакаат да ја научат најновата технологија на "Големи податоци", можат да го полагаат овој онлајн сертификат Big Data Hadoop сертификација

Предуслови

  • Не постои предуслов да се земе оваа голема податоци обука и да господар Hadoop. Но основите на UNIX, SQL и Java би биле добри. Во Intellipaat, ние обезбедуваме комплетен Unix и Java курс со нашата обука за сертификација на Big Data за да ги прошириме потребните вештини, така што ќе бидете добри за вас на патот за учење Hadoop.

Траење на курсот Времетраење: 2 дена

Вовед во големи податоци & Hadoop и нејзиниот екосистем, намалување на мапата и HDFS

Што е "Големи податоци", каде се вклопува Hadoop, Hadoop Дистрибуираниот датотечен систем - репликации, големината на блокот, секундарната намена, висока достапност, разбирање YARN - ResourceManager, NodeManager, Разлика помеѓу 1.x и 2.x

Hadoop Инсталација и подесување

Hadoop 2.x кластерска архитектура, федерација и висока достапност, типично поставување на кластери за производство, режими на Hadoop кластери, заеднички команди на Hadoop Shell, датотеки за конфигурација Hadoop 2.x, Кластерот за единечен јазол Cloudera

Длабоко се нурне во Mapreduce

Како функционира функцијата Mapreduce, Како Reducer работи, Како функционира возачот, Combiners, Partitioners, Формати на влез, Формати на излез, Shuffle и Sort, Поврзување со мапи, Намалување на странични приклучоци, MRUnit, Дистрибуиран кеш

Лабораториски вежби:

Работа со HDFS, Пишување WordCount програма, Пишување на сопствени партиција, Mapreduce со Combiner, Приклучување на страната на страницата, Намалување на страничните приклучоци, Тестирање на единицата Mapreduce, Водење на Mapreduce во LocalJobRunner режим

Решавање проблеми со графикот

Што претставува График, Графичко претставување, Прв алгоритм за пребарување, График Претставување на намалување на картата, Како да го направите Графичкиот алгоритам, Пример за намалување на графиконот на картата,

    Вежба 1: вежбање 2: вежбање 3:

Детално разбирање на свиња

A. Вовед во свиња

Разбирање на Apache-то прасе, карактеристики, разни намени и учење за интеракција со свиња

Б. Распоредување на свиња за анализа на податоци

Синтаксата на свинска латиница, различните дефиниции, сортирање и филтрирање податоци, типови на податоци, распоредување на свиња за ETL, вчитување податоци, преглед на шеми, дефиниции на полето, функции што најчесто се користат.

Свиња за сложена обработка на податоци

Различни типови на податоци, вклучувајќи вгнездени и комплексни, обработка на податоци со прасе, групирана итерација на податоци, практична вежба

Г. Вршење операции со мулти-податоци

Поставување на податоци, разделување на податоци, разни методи за комбинирање на податоци, поставени операции, практично вежбање

E. Проширување на свиња

Разбирање на кориснички дефинирани функции, вршење обработка на податоци со други јазици, увоз и макроа, користење на стриминг и UDFs за да се прошири прасе, практични вежби

Ф.

Работа со реални збирки на податоци кои вклучуваат Walmart и Electronic Arts како студија на случај

Детално разбирање на кошница

A. Кошница Вовед

Разбирање на Hive, традиционална база на податоци споредба со Hive, свиња и кошница споредба, чување на податоци во кошница и кошница шема, кошница интеракција и разни употреба случаи на кошница

B. Кошница за анализа на релациони податоци

Разбирање на HiveQL, основната синтакса, различните табели и бази на податоци, типови на податоци, приклучување на податоци, разни вградени функции, распоредување на прашањата за Hive на скрипти, школка и Hue.

Управување со податоци со Hive

Различни бази на податоци, создавање на бази на податоци, формати на податоци во Hive, моделирање на податоци, табели со помош на Hive, табели со самоуправување, вчитување податоци, менување на бази на податоци и табели, поедноставување на прашањата со Прегледи, складирање на резултатите, со Hive, Hive Metastore и Thrift серверот.

Д. Оптимизација на кошница

Учење ефикасноста на пребарување, индексирање на податоци, поделба и bucketing

Проширување на кошница

Распоредување на кориснички дефинирани функции за продолжување на кошница

F. Рацете на вежби - работа со големи збирки на податоци и широко пребарување

Распоредување на кошница за огромни количини на збирки на податоци и големи количини на доведување во прашање

G. UDF, оптимизација на барањето

Работење опширно со кориснички дефинирани пребарувања, учење како да ги оптимизирате пребарувањата, различни методи за извршување на подесување на перформансите.

Импала

A. Вовед во Импала

Што е Импала ?, Како Импала се разликува од кошница и свиња, Како Импала се разликува од релациони бази на податоци, ограничувања и идни насоки, со користење на Impala Shell

Б. Избор на најдобар (Кошница, Свиња, Импала)

В. Моделирање и управување со податоци со Impala и кошница

Преглед на складирање на податоци, Креирање бази на податоци и табели, Вчитување на податоци во табели, HCatalog, Импала метаподатоци кеширање

D. Поделба на податоци

Преглед на партиционирање, поделба во Импала и Кошница

(AVRO) формати на податоци

Избирање на формат на датотека, поддршка на алатки за формати на датотеки, агро шеми, користење на Avro со кошница и квадрат, Avro Schema Evolution, компресија

Вовед во Hbase архитектура

Што е Hbase, каде се вклопува, Што е NOSQL

Apache Spark

А. Зошто искра? Работа со Дистрибуиран датотечен систем Spark и Hadoop

Што е Spark, споредба помеѓу Spark и Hadoop, Компоненти на Искра

Компоненти на Спарк, Заеднички Искрачни Алгоритми-Итеративни Алгоритми, Графичка анализа, Машинско учење

Apache Spark - Вовед, конзистентност, достапност, поделба, унифициран оџак искра, компоненти на свеќички, пример за скалирање, махаут, бура, графикон

Вклучување на искра на кластер, пишување на апликации за искри со помош на Python, Java, Scala

Објаснете пример за python, Покажете инсталирање на искра, Објаснете ја програмата за возачот, Објаснете ја искрата контекст со пример, Дефинирајте ја слабо внесената променлива, Комбинирајте ја scala и java беспрекорно, Објаснете ја конкурентноста и дистрибуцијата., Објаснете што е карактеристика, Објасни функцијата со повисок ред со пример, Дефинирајте OFI распоредувач, Предности на искрата, Пример на Ламда користејќи искра, Објаснете го Mapreduce со пример

Hadoop кластерот за поставување и трчање карта ги намалува работните места

Конфигурација на повеќе јазли кластери користејќи Amazon ec2 - Креирање на подесување на кластери на кластери на 4, Вклучување на мапата Намалување на работни места на кластер

Големи проекти - Ставање на сето тоа заедно и Поврзување точки

Ставање на сето тоа заедно и Поврзување точки, Работа со големи сетови на податоци, Чекори кои се вклучени во анализа на големи податоци

ETL поврзување со Hadoop Екосистем

Како алатките ETL работат во индустријата за големи податоци, поврзување со HDFS од алатката ETL и преместување на податоци од локалниот систем на HDFS, пренесување на податоци од DBMS до HDFS, работа со hive со ETL алатката, креирање на мапа Намалување на работа во алатката ETL, крај до крај ETL PoC покажува голема интеграција на податоци со алатката ETL.

Конфигурација на кластери

Преглед на конфигурација и важна конфигурациска датотека, Конфигурациски параметри и вредности, Параметри на HDFS MapReduce параметри, подесување на Hadoop средина, Конфигурациски датотеки 'Вклучи' и 'Исклучи', Lab: MapReduce Tuning Performance

Администрација и одржување

Структури на директориуми и датотеки Namenode / Datanode, Слики на датотечниот систем и Уредување на дневникот, Процедурата за проверка, Namenode неуспех и процедура за наплата, Безбеден режим, Метаподатоци и Резервна копија на податоци, Потенцијални проблеми и решенија / Што да барате, Додавање и отстранување на јазли, Lab: MapReduce Обнова на датотечниот систем

Мониторинг и суспендирање на проблеми

Најдобри практики за следење на кластер, Користење на логови и следење на стекови за следење и решавање проблеми, Користење на алатки со отворен код за следење на кластерот

Распоред за работа: Мапа го намалува протокот на доставување на работа

Како да планирате Работни места на истиот кластер, FIFO Распоред, фер планирач и неговата конфигурација

Поставување на повеќе кластери на повеќе јазли и мапа за маневрирање ги намалуваат работните места на Amazon Ec2

Конфигурација на повеќе јазли кластери користејќи Amazon ec2 - Креирање на подесување на кластери на кластери на 4, Вклучување на мапата Намалување на работни места на кластер

ZOOKEEPER

ZOOKEEPER вовед, ZOOKEEPER услуги, ZOOKEEPER услуги, модел на податоци ZOOKEEPER, знаци и неговите типови, операции со Znodes, знаци часовници, читања и пишувања на знаците, гаранции за конзистенција, управување со кластери, лидерски избори, дистрибуирани ексклузивни заклучувања, важни точки

Напредување

Зошто Oozie ?, Инсталирање на Oozie, Водење на пример, Oozie-workflow мотор, Пример M / R акција, Пример за броење на примероци, Апликација за работното процесирање, Поднесување работни процеси, Работен тек на транзиции, Oozie работа за обработка, Oozie безбедност, Зошто Oozie безбедност? , Много закуп и приспособливост, Временска линија на Oozie работа, Координатор, Бовча, Слоеви на апстракција, Архитектура, Користете дело 1: временски предизвикувачи, Користете дело 2: податоци и временски предизвикувачи, Користете дело 3: тркалачки прозорец

Advance Flume

Преглед на Apache Flume, Физички дистрибуирани извори на податоци, Промена на структурата на податоци, Поблизок изглед, Анатомија на флуј, Основни концепти, Настан, Клиенти, Агенти, Извори, Канали, Митови, Пресретнувачи, Избирач на канали, Процесор за мијалник, Податоци ingest, , Трансакциска размена на податоци, рутирање и реплицирање, Зошто канали ?, Користете случај-агрегација на дневникот, Додавање агенс, обработка на фарма на сервери, Обем на податоци по агент, Пример за опишување на единечен јазол

Advance HUE

HUE вовед, HUE екосистем, Што е HUE ?, HUE реален свет, Предности на HUE, Како да испраќате податоци во File Browser ?, Преглед на содржината, Интегрирање на корисници, Интегрирање на HDFS, Основи на HUE FRONTEND

Advance Impala

IMPALA Преглед: Цели, поглед на корисник на Impala: Преглед, кориснички поглед на Impala: SQL, кориснички приказ на Impala: Apache HBase, Impala архитектура, државна продавница Импала, каталог на Impala, фази на извршување на Query, споредување на Impala да кошница

Hadoop Примена тестирање

Зошто тестирањето е важно, Единица за тестирање, Интеграција тестирање, Тестирање на ефикасноста, Дијагностика, Ноќен QA тест, Бенчмарк и крај до крај тестови, Функционални тестирање, издавање сертификати тестирање, Безбедносно тестирање, Приспособливост тестирање, пуштање во работа и затворање на тестирање на податоци јазли, , Тест за ослободување

Улоги и одговорности на Професионалец за тестирање на Hadoop

Разбирање на Барањето, подготовка на Проценка на тестирање, Тест случаи, Тестови на податоци, Креирање тест-тест, Извршување на тестови, Известување за дефекти, Дефект повторување, Дневен извештај за состојбата на извештајот, Тест завршување, ETL тестирање во секоја фаза (HDFS, HIVE, HBASE) вчитување на влезот (логови / датотеки / записи итн.) со помош на sqoop / flume кој вклучува, но не се ограничува, проверка на податоците, помирување, овластување за корисникот и проверка на автентичност (групи, корисници, привилегии итн.), извештаи за дефекти на тимот за развој или менаџер и возење да ги затворат, да ги консолидираат сите дефекти и да создадат извештаи за дефекти, да ја потврдат новата опција и проблеми во Core Hadoop.

Рамка наречена МР единица за тестирање на програми за намалување на мапите

Пријавете дефекти на развојниот тим или менаџер и ги заведувате до затворање, да ги консолидирате сите дефекти и да создадете извештаи за дефекти, одговорен за креирање на рамка за тестирање наречена МР единица за тестирање на програми за намалување на картата.

Тестирање на единици

Тестирање на автоматизација со помош на OOZIE, валидација на податоци со користење на алатката за пренапони за пребарување.

Тест Извршување

Тест-план за надградба на HDFS, автоматизација на тест и резултат

Тест план стратегија и пишување Тест случаи за тестирање Hadoop апликација

Како да тестирате инсталирате и конфигурирате

Поддршка за работа и сертификација

Cloudera сертификација совети и упатство и потсмеваат на интервју за подготовка, Практичен развој совети и техники

Ве молиме пишете ни на info@itstechschool.com и контактирајте не на + 91-9870480053 за цената на курсот и трошоците за сертификација, распоредот и локацијата

Испушти го барањето

Овој курс за обука е дизајниран да ви помогне да ги исчистите двете Cloudera Spark и Hadoop Developer Certification (CCA175) испит и Cloudera овластен администратор за Apache Hadoop (CCAH) испит. Целата содржина на курсот за обука е во согласност со овие две програми за сертификација и ви помага да ги исчистите овие сертификациски испити со леснотија и да ги добиете најдобрите работни места во првите МНК.

Како дел од оваа обука ќе се работи на проекти во реално време и задачи кои имаат огромни импликации во реалниот свет сценарио, со што ќе ви помогне брзо да ја следите вашата кариера без никаков напор.

На крајот од оваа програма за обука ќе има квизови кои совршено ќе ги одразуваат видот на прашањата поставени на соодветните испити за сертификација и ќе ви помогнат да постигнете подобри оценки во испитот за сертификација.

ИТС сертификат за завршување на курсот ќе бидат доделени на завршување на проектната работа (за стручен преглед) и по постигнување на најмалку 60% марки во квизот. Сертификатот Intellipaat е добро познат во највисоките 80 + MNC, како Ериксон, Cisco, Cognizant, Sony, Mu Sigma, Сен-Гобан, Стандард Лидер, TCS, Genpact, Hexaware итн.

За повеќе информации љубезно Контактирајте не.


Осврти