uriClassroom Training
REGISTER

Makipag-ugnay sa

Field na minarkahan ng * ay kinakailangan

 

malaking data hadoop certification course

Big Data Hadoop Certification Course & Training

Pangkalahatang-ideya

Mga Madla at Mga Kinakailangan

Balangkas ng Kurso

Iskedyul at Mga Bayarin

certification

Pangkalahatang-ideya ng Pangkalahatang-ideya ng Big Data Hadoop Course

Ito ay isang komprehensibong kurso sa pagsasanay sa Hadoop Big Data na dinisenyo ng mga eksperto sa industriya na isinasaalang-alang ang kasalukuyang mga kinakailangan sa industriya ng trabaho upang magbigay ng malalim na pag-aaral sa malaking data at Module ng Hadoop. Ito ay isang industriya na kinikilala ang kurso ng pagsasanay sa sertipikasyon ng Big Data na isang kumbinasyon ng mga kurso sa pagsasanay sa developer Hadoop, administrator ng Hadoop, Hadoop testing, at analytics. Ito Cloudera Hadoop training ay maghahanda sa iyo upang i-clear ang malaking sertipikasyon ng data.

Layunin

  • Master fundamentals ng Hadoop 2.7 at YARN at magsulat ng mga application gamit ang mga ito
  • Pag-set up ng Pseudo node at Multi node cluster sa Amazon EC2
  • Master HDFS, MapReduce, Hive, Pig, Oozie, Sqoop, Flume, Zookeeper, HBase
  • Matuto Spark, Spark RDD, Graphx, MLlib writing applications Spark
  • Mga gawain ng administrador ng Master Hadoop tulad ng kumpol na pamamahala, pagsubaybay, pangangasiwa at pag-troubleshoot
  • Pag-configure ng mga tool ng ETL tulad ng Pentaho / Talend upang gumana sa MapReduce, Hive, Pig, atbp
  • Detalyadong pag-unawa sa analytics ng Big Data
  • Mga application ng pagsubok ng Hadoop gamit ang MR Unit at iba pang mga tool ng automation.
  • Makipagtulungan sa mga format ng data ng Avro
  • Magsagawa ng mga proyekto sa real-buhay gamit ang Hadoop at Apache Spark
  • Gagamitin upang i-clear ang Big Data Hadoop Certification.

inilaan Audience

  • Programming Developers and System Administrators
  • Nakaranas ng mga propesyonal na nagtatrabaho, Mga tagapamahala ng proyekto
  • Big DataHadoop Developers sabik na matuto ng iba pang mga vertical tulad ng Pagsubok, Analytics, Pangangasiwa
  • Mainframe Professionals, Architects & Testing Professionals
  • Business Intelligence, Data Warehousing at Analytics Professionals
  • Ang mga nagtapos, ang mga undergraduates na sabik na matutunan ang pinakabagong teknolohiya ng Big Data ay maaaring tumagal ng online na Pagsasanay ng Big Data Hadoop Certification

Kinakailangan

  • Walang pre-requisite na kunin ang Big training na ito at mag-master ng Hadoop. Ngunit ang mga pangunahing kaalaman ng UNIX, SQL at java ay magiging mabuti. Sa Intellipaat, nagbibigay kami ng komplimentaryong Unix at Java course kasama ang aming Big Data certification training upang mag-brush-up ng kinakailangang mga kasanayan upang ikaw ay mabuti sa iyo Hadoop pag-aaral ng landas.

Course Outline Duration: 2 Days

Panimula sa Big Data & Hadoop at Ecosystem nito, Mapa Bawasan at HDFS

Ano ang Big Data, Saan ang Hadoop ay angkop sa, Hadoop na ibinahagi File System - Mga Replikasyon, Sukat ng Block, Pangalawang Namenode, Mataas na Availability, Pag-unawa sa YARN - ResourceManager, NodeManager, Pagkakaiba sa pagitan ng 1.x at 2.x

Pag-install at Pag-setup ng Hadoop

Hadoop 2.x Cluster Architecture, Federation at High Availability, Isang tipikal na Production Cluster setup, Hadoop Cluster Modes, Common Hadoop Shell Commands, Hadoop 2.x Configuration Files, Cloudera Single node cluster

Deep Dive in Mapreduce

Paano Gumagana ang Mapreduce, Paano Gumagana ang Reducer, Paano Gumagana ang Driver, Combiner, Partitioner, Mga Format ng Input, Mga Format ng Output, Shuffle at Pagsunud-sunurin, Mapped Joins, Bawasan ang Side Joins, MRUnit, Distributed Cache

Magsanay ng lab:

Paggawa gamit ang HDFS, Pagsusulat ng WordCount Program, Pagsusulat ng custom partitioner, Mapreduce sa Combiner, Map Side Sumali, Bawasan ang Mga Kasama ng Pagsali, Unit Testing Mapreduce, Running Mapreduce sa LocalJobRunner Mode

Paglutas ng Problema sa Graph

Ano ang Graph, Graph Representation, unang bahagi ng Algorithm sa Paghahanap, Graph Representation ng Mapa Bawasan, Paano gawin ang Graph Algorithm, Halimbawa ng Mapa ng Mapa Bawasan,

    Exercise 1: Exercise 2: Exercise 3:

Detalyadong pag-unawa sa Pig

A. Panimula sa Pig

Pag-unawa sa Apache Pig, ang mga tampok, iba't ibang gamit at pag-aaral upang makipag-ugnay sa Pig

B. Pag-deploy ng Pig para sa pagtatasa ng data

Ang syntax ng Pig Latin, ang iba't ibang mga kahulugan, uri ng data at filter, mga uri ng data, pag-deploy ng Pig para sa ETL, pag-load ng data, pagtingin sa schema, mga kahulugan ng field, mga function na karaniwang ginagamit.

C. Pig para sa kumplikadong data processing

Iba't ibang mga uri ng data kabilang ang nested at kumplikadong, pagpoproseso ng data sa Pig, pinagsama data na pag-ulit, praktikal na ehersisyo

D. Gumaganap ng mga operasyon ng multi-dataset

Nagtatakda ng data na sumali, naghiwalay ng data set, iba't ibang mga pamamaraan para sa hanay ng data na pinagsasama, nagtatakda ng mga pagpapatakbo, hands-on exercise

E. Pagpapalawak ng Pig

Pag-unawa sa mga function ng tinukoy ng gumagamit, pagsasagawa ng pagpoproseso ng data sa iba pang mga wika, pag-import at macros, gamit ang streaming at UDFs upang mapalawak ang Pig, praktikal na pagsasanay

F. Mga Trabaho sa Pig

Paggawa gamit ang mga tunay na hanay ng data na kinasasangkutan ng Walmart at Electronic Arts bilang case study

Detalyadong pag-unawa sa pugad

A. Hive Introduction

Pag-unawa sa pugad, tradisyonal na paghahambing ng database sa pugad, Pig at pugayan ng paghahambing, pagtatago ng data sa pugad at pugad ng panukala, pugad na pakikipag-ugnayan at iba't ibang mga kaso ng paggamit ng pugad

B. Hive para sa pamanggit na pagtatasa ng data

Ang pag-unawa sa HiveQL, pangunahing syntax, ang iba't ibang mga talahanayan at database, mga uri ng data, data set na sumali, iba't ibang mga built-in na function, pag-deploy ng mga query na Hive sa mga script, shell at Hue.

C. pamamahala ng data na may pugad

Ang iba't-ibang mga database, paglikha ng mga database, mga format ng data sa pugad, data pagmomolde, Mga pinagtitipunan na mga table, mga self-pinamamahalaang Table, pag-load ng data, pagbabago ng mga database at Mga Table, pagpapadali ng query sa Mga Pananaw, pag-iimbak ng mga query, pag-access ng data ng kontrol, pamamahala ng data na may pugad, pugad ng Metastore at Thrift server.

D. Pag-optimize ng pugad

Pag-aaral ng pagganap ng query, data index, partitioning at bucketing

E. Pagpapalawak ng pugad

Pag-deploy ng mga tinukoy na function ng gumagamit para sa pagpapalawak ng pugad

F. Hands on Exercises - nagtatrabaho sa mga malalaking hanay ng data at malawak na pag-query

Deploying Hive para sa mga malalaking volume ng mga hanay ng data at malalaking halaga ng pag-query

G. UDF, query optimization

Paggawa nang husto sa Mga Quined na Tinukoy ng User, pag-aaral kung paano i-optimize ang mga query, iba't ibang mga paraan upang magawa ang pagganap ng pag-tune.

Impala

A. Panimula sa Impala

Ano ang Impala ?, Kung paano Impala Iba't ibang mula sa pugad at Pig, Paano Impala Iba't ibang mula sa Relational Database, Mga Limitasyon at Mga Direksyon sa Hinaharap, Gamit ang Impala Shell

B. Pagpili ng Pinakamagandang (pugad, Pig, Impala)

C. Modeling at Pamamahala ng Data sa Impala at pugad

Pangkalahatang-ideya ng Imbakan ng Data, Paglikha ng Mga Database at Mga Table, Pag-load ng Data sa Mga Table, HCatalog, Impala Metadata Caching

D. Data Partitioning

Pangkalahatang-ideya ng Partitioning, Partitioning sa Impala at Hive

(AVRO) Mga Format ng Data

Pagpili ng Format ng File, Suporta ng Tool para sa Mga Format ng File, Avro Schemas, Paggamit ng Avro sa pugad at Sqoop, Avro Schema Evolution, Compression

Panimula sa architecture ng Hbase

Ano ang Hbase, Saan naaangkop, Ano ang NOSQL

Apache Spark

A. Bakit Spark? Paggawa gamit ang Spark at Hadoop na Distributed File System

Ano ang Spark, Paghahambing sa pagitan ng Spark at Hadoop, Mga Bahagi ng Spark

B. Spark Components, Common Spark Algorithms-Iterative Algorithms, Pagsusuri ng Graph, Pag-aaral ng Machine

Apache Spark- Panimula, Pagkakasunud-sunod, Pagkakaroon, Partisyon, Pinag-isang Stack Spark, Mga Bahagi ng Spark, Nakakatakot na halimbawa, mahout, bagyo, graph

C. Pagpapatakbo ng Spark sa isang Cluster, Pagsusulat ng Mga Application ng Spark gamit ang Python, Java, Scala

Ipaliwanag ang halimbawa ng python, Ipakita ang pag-install ng isang spark, Ipaliwanag ang programa ng driver, Ipinapaliwanag ang konteksto ng spark na may halimbawa, Tukuyin ang mahina na variable ng pag-type, Pagsamahin ang scala at java na walang putol, Ipaliwanag ang concurrency at pamamahagi., Ipaliwanag kung ano ang katangian, Ipaliwanag ang mas mataas na function ng order sa halimbawa, Itakda OFI scheduler, Mga Bentahe ng Spark, Halimbawa ng Lamda gamit ang spark, Ipaliwanag ang Mapreduce na may halimbawa

Pag-setup ng Hadoop Cluster at Pagpapatakbo ng Mapa Bawasan ang Mga Trabaho

Multi Node Cluster Setup gamit ang Amazon ec2 - Paglikha ng 4 node cluster setup, Running Map Bawasan ang Trabaho sa Cluster

Major Project - Ang paglalagay ng lahat ng ito nang magkasama at Pagkonekta ng Mga Dot

Paglalagay ng lahat ng ito nang magkasama at Pagkonekta sa Mga Dot, Paggawa gamit ang Malaking hanay ng data, Mga hakbang na kasangkot sa pag-aaral ng malalaking data

ETL pagkakakonekta sa Hadoop Ecosystem

Paano gumagana ang mga tool ng ETL sa Big data Industry, Pagkonekta sa HDFS mula sa ETL tool at paglipat ng data mula sa Lokal na sistema patungo sa HDFS, Paglilipat ng Data mula sa DBMS sa HDFS, Paggawa gamit ang pugad sa ETL Tool, Paglikha ng Mapa Bawasan ang trabaho sa ETL tool, End to End ETL PoC na nagpapakita ng malaking data integration sa ETL tool.

Configuration ng Cluster

Pangkalahatang-ideya ng configuration at mahalagang file ng configuration, Mga parameter at halaga ng configuration, Mga parameter ng HDFS MapReduce parameter, Pag-setup ng Hadoop na kapaligiran, Mga file ng pagsasaayos ng 'Isama' at 'Ibukod', Lab: MapReduce Pagganap ng Pag-tune

Pangangasiwa at Pagpapanatili

Namenode / Datanode na direktoryo ng mga istraktura at mga file, File system na imahe at I-edit ang log, Ang Checkpoint Pamamaraan, Namenode kabiguan at pagbawi pamamaraan, Safe Mode, Metadata at Data backup, Potensyal na mga problema at mga solusyon / kung ano ang hahanapin, Pagdaragdag at pag-alis ng mga node, Lab: MapReduce File system Recovery

Pagsubaybay at Pag-troubleshoot

Pinakamahusay na kasanayan sa pagsubaybay sa isang kumpol, Gamit ang mga log at stack na bakas para sa pagsubaybay at pag-troubleshoot, Paggamit ng mga tool ng open-source upang masubaybayan ang kumpol

Job Scheduler: Mapa bawasan ang daloy ng pagsumite ng trabaho

Paano mag-iskedyul ng Trabaho sa parehong cluster, FIFO Schedule, Fair Scheduler at configuration nito

Multi Node Cluster Setup at Running Map Bawasan ang Trabaho sa Amazon Ec2

Multi Node Cluster Setup gamit ang Amazon ec2 - Paglikha ng 4 node cluster setup, Running Map Bawasan ang Trabaho sa Cluster

ZOOKEEPER

ZOOKEEPER Panimula, ZOOKEEPER Gumagamit ng mga kaso, ZOOKEEPER Serbisyo, ZOOKEEPER data Modelo, Znodes at mga uri nito, Znodes operasyon, Znodes relo, Znodes bumabasa at writes, Consistency Guarantees, pamamahala ng Cluster, Leader Election, ibinahagi Eksklusibo Lock, Mahalaga puntos

Advance Oozie

Bakit Oozie ?, Pag-install ng Oozie, Pagpapatakbo ng isang halimbawa, Oozie-workflow engine, Halimbawa ng pagkilos M / R, Salita bilang halimbawa, Workflow application, Pagsusumite ng Workflow, Workflow transisyon ng estado, Oozie pagpoproseso ng trabaho, Oozie seguridad, Bakit Oozie seguridad? , Multi-tenancy at scalability, Oras ng trabaho ng Oozie, Coordinator, Bundle, Mga Layer ng abstraction, Arkitektura, Paggamit ng Kaso 1: pag-trigger ng oras, Paggamit ng Kaso 2: pag-trigger ng data at oras, Paggamit ng Kaso 3: rolling window

Advance Flume

Pangkalahatang-ideya ng Apache Flume, Pisikal na ipinamamahagi Pinagmumulan ng data, Pagbabago ng istraktura ng Data, Malapit na hitsura, Anatomiya ng Flume, Mga konsepto ng Core, Kaganapan, Kliyente, Ahente, Pinagmulan, Mga Channel, Mga Sink, Interceptor, Tagapili ng Channel, Sink processor, Data ingest, Ahente ng tubo , Transaksyon ng data exchange, Routing at replicating, Bakit mga channel ?, Paggamit ng kaso-Pagsasama ng log, Pagdaragdag ng flume agent, Paghawak ng isang farm server, Dami ng data sa bawat ahente, Halimbawa na naglalarawan ng isang pag-deploy ng node flume

Advance HUE

HUE introduction, HUE ecosystem, Ano ang HUE ?, HUE totoong view ng mundo, Kalamangan ng HUE, Paano mag-upload ng data sa File Browser ?, Tingnan ang nilalaman, Pagsasama ng mga gumagamit, Pagsasama ng HDFS, Fundamentals of HUE FRONTEND

Advance Impala

IMPALA Pangkalahatang-ideya: Mga Layunin, Pagtingin ng gumagamit ng Impala: Pangkalahatang-ideya, Pagtingin ng gumagamit ng Impala: SQL, Pagtingin ng gumagamit ng Impala: Apache HBase, Impala architecture, Impala na estado store, Impala catalog service, Query pagpapatupad phase,

Pagsubok ng Hadoop Application

Bakit pagsubok ay mahalaga, Unit testing, Pagsubok sa Pagsasama, Pagganap ng pagsubok, Diagnostics, Nightly QA test, Benchmark at dulo sa mga pagtatapos ng pagsubok, Functional testing, Paglabas ng sertipikasyon pagsubok, Security testing, Scalability Testing, Commissioning at Decommissioning ng Data Nodes Testing, Reliability testing , Bitawan ang pagsubok

Mga Tungkulin at Pananagutan ng Hadoop Testing Professional

Pag-unawa sa Kinakailangan, Paghahanda ng Pagtatasa ng Pagsusuri, Mga Pagsubok sa Pagsubok, Pagsubok ng Data, Paglikha ng pagsubok sa kama, Pagpapatupad ng Pagsubok, Pag-uulat ng Kapansanan, Retest Retest, Paghahatid ng ulat sa Araw ng Katayuan, Pagkumpleto ng pagsubok, ETL na pagsubok sa bawat yugto (HDFS, HIVE, HBASE) habang load ang input (mga tala / file / mga tala atbp) gamit ang sqoop / flume na kinabibilangan ngunit hindi limitado sa pag-verify ng data, Pagkakasundo, Awtorisasyon ng User at pagsubok ng Authentication (Mga Grupo, Mga User, Mga Pribilehiyo atbp), Ulat ng mga depekto sa pangkat ng pag-unlad o manager at pagmamaneho pagsara sa mga ito, Pagsamahin ang lahat ng mga depekto at lumikha ng mga ulat ng depekto, Pagpapatunay ng bagong tampok at mga isyu sa Core Hadoop.

Ang Framework ay tinatawag na MR Unit para sa Pagsubok ng Map-Bawasan ang Mga Programa

Mag-ulat ng mga depekto sa pangkat ng pag-unlad o tagapamahala at patakbuhin ang mga ito sa pagsasara, I-consolidate ang lahat ng mga depekto at lumikha ng mga ulat ng depekto, Responsable para sa paglikha ng isang pagsubok na Framework na tinatawag na MR Unit para sa pagsubok ng Map-Bawasan ang mga programa.

Pagsubok ng Unit

Automation testing gamit ang OOZIE, Data validation gamit ang query surge tool.

Pagsubok ng Pagsubok

Plano ng pagsubok para sa pag-upgrade ng HDFS, Pag-aautomat ng pagsubok at resulta

Diskarte sa Pagsubok ng Pagsusulit at Pagsusulat ng Mga Test Case para sa pagsubok ng Hadoop Application

Paano mag-install ng pag-install at i-configure

Suporta sa Trabaho at Sertipiko

Mga Tip sa Certification ng Cloudera at Guidance at Mock Interview Paghahanda, Praktikal na Mga Tip at Diskarte sa Pag-unlad

Mangyaring sumulat sa amin sa info@itstechschool.com at makipag-ugnay sa amin sa + 91-9870480053 para sa presyo ng kurso at gastos sa sertipikasyon, iskedyul at lokasyon

I-drop sa Amin ang isang Query

Ang kurso sa pagsasanay na ito ay idinisenyo upang matulungan kang i-clear ang kapwa Cloudera Spark at Hadoop Developer Certification (CCA175) pagsusulit at Ang Cloudera Certified Administrator para sa Apache Hadoop (CCAH) pagsusulit. Ang buong nilalaman ng kurso sa pagsasanay ay nakahanay sa dalawang programang ito ng sertipikasyon at tumutulong sa iyo na i-clear ang mga pagsusulit sa sertipikasyon nang madali at makuha ang pinakamahusay na mga trabaho sa mga nangungunang MNCs.

Bilang bahagi ng pagsasanay na ito ikaw ay nagtatrabaho sa mga proyekto ng real time at mga takdang-aralin na may napakalawak na implikasyon sa tunay na sitwasyon sa industriya ng mundo kaya tinutulungan ka nang mabilis na subaybayan ang iyong karera nang walang kahirap-hirap.

Sa dulo ng programang pagsasanay na ito magkakaroon ng mga pagsusulit na ganap na sumasalamin sa uri ng mga tanong na hiniling sa mga pagsusulit sa sertipikasyon at tumutulong sa iyo na mas puntos ang mas mahusay na marka sa pagsusulit sa sertipikasyon.

ITS Course Completion Certificate ay iginawad sa pagkumpleto ng Proyekto sa trabaho (sa pagsusuri ng ekspertong) at sa pagmamarka ng hindi bababa sa 60% marka sa pagsusulit. Ang Intellipaat certification ay mahusay na kinikilala sa mga nangungunang 80 + MNCs tulad ng Ericsson, Cisco, Cognizant, Sony, Mu Sigma, Saint-Gobain, Standard Chartered, TCS, Genpact, Hexaware, atbp.

Para sa higit pang impormasyon mabait Makipag-ugnayan sa amin.


Mga review