Что такое Hadoop

Обновлено и опубликовано Опубликовано:

Hadoop —
простыми словами

набор инструментов для разработки программ и обеспечения среды для их запуска в распределенной среде. Позволяет создавать большие кластеры и упрощает процесс управления ими. Является одним из элементов конвейеров обработки больших данных. Разработан на Java фондом Apache Software Foundation.

Состоит из модулей:

  • Common — для связи в единое целое других компонентов.
  • HDFS — распределённая файловая система.
  • YARN — планирование заданий и управление кластером.
  • MapReduce — платформа программирования и выполнения распределённых MapReduce-вычислений.

Преимущества Hadoop:

  • Надежность.
  • Маштабируемость.
  • Отказоустойчивость.
  • Портируемость.

Подробнее о Hadoop на Википедии.

Встречается в статьях

Мини-инструкции:

  1. Как установить и настроить кластер Hadoop на Linux Ubuntu


Дмитрий Моск
— IT-специалист.
Настройка серверов, услуги DevOps.

Другие термины

OpenVPN     OEM   HDMI   MySQL   Zookeeper   OpenVZ   Ошибка 404   Видеокарта   Yahoo   Rocky Linux   Vagrant   Маска сети   Apache   PostGIS   Iptables   Домен   WPS   Сервер   IAX  
.....

Реклама