Что такое Hadoop

Обновлено и опубликовано Опубликовано:

Hadoop —
простыми словами

набор инструментов для разработки программ и обеспечения среды для их запуска в распределенной среде. Позволяет создавать большие кластеры и упрощает процесс управления ими. Является одним из элементов конвейеров обработки больших данных. Разработан на Java фондом Apache Software Foundation.

Состоит из модулей:

  • Common — для связи в единое целое других компонентов.
  • HDFS — распределённая файловая система.
  • YARN — планирование заданий и управление кластером.
  • MapReduce — платформа программирования и выполнения распределённых MapReduce-вычислений.

Преимущества Hadoop:

  • Надежность.
  • Маштабируемость.
  • Отказоустойчивость.
  • Портируемость.

Подробнее о Hadoop на Википедии.

Встречается в статьях

Мини-инструкции:

  1. Как установить и настроить кластер Hadoop на Linux Ubuntu
Дмитрий Моск
— IT-специалист.
Настройка серверов, компьютерная помощь.

Другие термины

ЦОД   SpamAssassin   Hadoop   TeamPass   JQuery   CI/CD   Memcached   Corosync   ISO-образ   Consul   USB   PostfixAdmin   Bluetooth   DHCP   IP-адрес   OpenVPN   PhpMyAdmin   PHP-FPM   Битрикс24   UEFI  
.....

Реклама