Что такое Hadoop

Обновлено и опубликовано Опубликовано:

Hadoop —
простыми словами

набор инструментов для разработки программ и обеспечения среды для их запуска в распределенной среде. Позволяет создавать большие кластеры и упрощает процесс управления ими. Является одним из элементов конвейеров обработки больших данных. Разработан на Java фондом Apache Software Foundation.

Состоит из модулей:

  • Common — для связи в единое целое других компонентов.
  • HDFS — распределённая файловая система.
  • YARN — планирование заданий и управление кластером.
  • MapReduce — платформа программирования и выполнения распределённых MapReduce-вычислений.

Преимущества Hadoop:

  • Надежность.
  • Маштабируемость.
  • Отказоустойчивость.
  • Портируемость.

Подробнее о Hadoop на Википедии.

Встречается в статьях

Мини-инструкции:

  1. Как установить и настроить кластер Hadoop на Linux Ubuntu


Дмитрий Моск
— IT-специалист.
Настройка серверов, услуги DevOps.

Другие термины

Icecast   Prometheus   Asterisk   TeamPass   1С:Предприятие   Windows   PhpMyAdmin   Podman   CPanel   DHCP   Контроллер домена   Термопаста   USB   BalenaOS   UWSGI   Видеокарта   POP3   7-zip   OEM   Ceph  
.....

Реклама