Что такое Hadoop

Обновлено и опубликовано Опубликовано:

Hadoop —
простыми словами

набор инструментов для разработки программ и обеспечения среды для их запуска в распределенной среде. Позволяет создавать большие кластеры и упрощает процесс управления ими. Является одним из элементов конвейеров обработки больших данных. Разработан на Java фондом Apache Software Foundation.

Состоит из модулей:

  • Common — для связи в единое целое других компонентов.
  • HDFS — распределённая файловая система.
  • YARN — планирование заданий и управление кластером.
  • MapReduce — платформа программирования и выполнения распределённых MapReduce-вычислений.

Преимущества Hadoop:

  • Надежность.
  • Маштабируемость.
  • Отказоустойчивость.
  • Портируемость.

Подробнее о Hadoop на Википедии.


Встречается в статьях

Мини-инструкции:

  1. Как установить и настроить кластер Hadoop на Linux Ubuntu
Дмитрий Моск
— IT-специалист.
Настройка серверов, услуги DevOps.

Другие термины

Redis   Dnsmasq   SpamAssassin   VPN   Кулер   Winsock   PHP   RSS   Битрикс24   GlusterFS   Терминальный сервер   Selinux   DFS   PAM   Клавиша Windows   Roundcube   RAW (файловая система)   HAProxy   POP3   Postfix  
.....

Реклама