Blog

р-код
1 Dec 2017

10 нерсе R жөнүндө эмнени билишим керек, Python жана Hadoop

/
Posted By

Сиз 10 себептери билиши керек R, Python жана Hadoop

Маалымат Аналитика Domain биз белгилүү билген бир кызматы, же SaaS уюмдардын, ошондой эле Программанын боюнча күтүүлөрдү ашып жатат. Ар бир адам кирип, керек Big маалыматтар Алар Шаарга иши үчүн тешиктери тонна бар. Бирок, маалыматтар илимдер алдыга кыса кабыл алуу, ал жөнүндө жана чечүү үчүн Data Science Тастыктоо кайсы түшүнө негизги болуп саналат. Бул жер R, Python жана Hadoop келип, бул жерде билүү үчүн он улуу стимулдардын болуп саналат. Бул олуттуу Google, Америка банкынын жана New York Times сыяктуу жарадар аттарын камтыган маалымат илимдердин тармагына кирип барууга үйрөнүш керек, диалектилеринде программалоо жатышат.

Мүмкүндүк алуу:Кантип дагы бир кардар, аларды үйрөнүү үчүн эмне талап кылынат? R, мисалы, ишке киргизүү жана жүргүзүүгө уруксат берилет жана, кардарларга отуруп, тема тууралуу билүү үчүн өз алдынчалыгын берет. Python, Андан кийин дагы бир жолу, үйрөнүү аз талап болуп саналат жана бир нече аны программалоо тилинин диалектиси болгон түз дешет. Hadoop, Ал иштин жеткиликтүү кылат дагы бир жолу ачык булагы системаларга жеткиликтүү болуп саналат. Сиздин жайгаштыруу көз каранды, кардар алардын кайсы тарта алат. жөнөкөй

нуска: Ал эми маалымат экспертиза кызыкдар болуп, бул үч ачык программалоо диалектилери көпчүлүк негизги болуп саналат. Маалымат импорттук өкүлчүлүгү, MapReduce жана параллелдүү иштетүү аларга дагы аз талап кылып жатат катталган тергөө этаптары дайыма да коозураак болушу керек болгон бир кесепети, ошондой эле мыкты, алар менен аткарылышы мүмкүн.

Кайчылаш платформа: программалоо диалектилери Windows баардык окшош ар кандай стадияда, колдонулушу, Mac OS X, Linux жана жубайлар ар кандай көп, кардарлардын уруксат кандай шаймандын өз ишин аягына чейин болот. R жана Python дизайнерлер учурда көп маалымат, бүрүшүп көп стадияда өлчөмдөрү башкаруу ыкмаларын ойлоп, жана SQL жана NoSQL базасына да бир ок жатат.

Кескин Simple жасады: Бул үч программалоо диалектилери да Big Data деп аталган зор жана татаал маалымат, кам көрүү үчүн колдонулууда. Оор жана татаал recreations элиталык топтордун же көп кайра иштетүүчүлөр менен диалектилер, пайдалануу менен салыштырмалуу жөнөкөй болушу керек. Python R Бирок экөө тең жакшы талкууланган нерселердин баарынан жогору маалыматты .Ахыры HadoopБерүү кардарлар менен иштетүү үчүн кайсы бир алыш үчүн ар кандай багыттары боюнча жараша тандоо.

Укмуш жагат: Мындай көп сандаган артыкчылыктарга менен диалектилерди комиссия таануу жана тегерегиндеги 2 млн кардарлар дүйнө жүзү боюнча, аларды пайдалануу боюнча кёбёйгён маалыматтар илимде башкаруу жатканда. Эми R Oracle менен кароо жөндөмүн боюнча көбөйдү карата абал боюнча, SAP, Netezza жана Teredata илимий колдоо катары R утилдештирүү Interfaces түзүү баштады.

Өлчөнүүчү ачылыштар: программалоо өзгөрүүлөр ар бир жаңы жакшыртуу, алар абдан өнүккөн жана аларга ылайыкташа себеби dependably ушул үч диалектилеринин бири болууда. FF жана bigmemory сыяктуу жаңы өнүгүшү менен, ал эс-көп топтомун башкаруу үчүн азыркы алмашылып турат. Python бир топ натыйжалуу жана мезгилдештирүү менен маалымат .Ахыры Hadoop атайын сыйлык.

Publishing жөнөкөй: программалоо диалектилери жазуу таратуу менен эле киргизет, алар distributer жогорку тандоо болуп саналат. укуктук базаны, ошондой эле сөз ташуу отчетторунда орнотулган жаткан компоненттерин таратуу LaTeX жазуулардын менен капталган соруу көрсөтүү үчүн кошумча гигант болуп саналат. диалектилеринин ар бири, ал жөнөкөй таратуу жана маалыматтын зор көлөмүн аткаруу үчүн кабыл алуу, олуттуу биологиялык системаларды бар.

колдонууга Easy: R, Hadoop жана Python түшүнүктүү жана тоскоолдук иштөөгө кандайдыр бир буюм менен ар бир кардарга жол, Microsoft Excel, Access, MySQL, SQLite жана Oracle маалымат ташып тиреп турат. Python ийгиликтүү Жаратылыш Тили кайра иштетүү жана Apache Искра үчүн пайдаланылат табылган маалымат берди Hadoop натыйжалуу ачык кагынан жүздү +.

Уюштуруу: Community байланыштар жана системалар башкаруу кандайдыр бир дүйнөлүк бирикмесинин маанилүү бөлүгү болуп саналат жана шыктануу менен кардарлар дайыма оң маалыматтарды ырааттуу соода кепилдик, бул диалектилери жөнүндө көп нерселерди көрө алар менен сүйлөшкөнүм түзүлүштөрдү ара жатышат. Жакында Anaconda жүрүүчү келечектеги боо үчүн көкүтүшү аларды, аларды талкуулоого дүйнө жүзү боюнча кардарлардын мактаса изилдөөлөр койгон 300 же боо эсе көп каражат бөлөт.

Simple Debugging: Издөөдө жана тергөө көбүрөөк кетчү билүүсү менен идеалдуу нерселер үчүн кардарларды уруксат берүү, көпчүлүк чечүү аппараттар бул диалектилери ылайык келтирсин жасалган экенин бул диалектилердин башкаларга караганда жарык менен аз талап болуп саналат. Ар бир диалект өз артыкчылыктар да, кемчиликтер да бар, бирок, башкача айтканда, R, Python жана Hadoop иш-чаралар, ошондой эле негиздерди коопсуз жана бүтүндөй базасын кайра түзүү үчүн зарыл иш-чаранын мыкты альтернатива үчүн пайдалануу күтүүгө болот эле.

Таштап Жооп

GTranslate Please upgrade your plan for SSL support!
GTranslate Your license is inactive or expired, please subscribe again!