Что такое Hadoop

Обновлено и опубликовано Опубликовано:

Hadoop —
простыми словами

набор инструментов для разработки программ и обеспечения среды для их запуска в распределенной среде. Позволяет создавать большие кластеры и упрощает процесс управления ими. Является одним из элементов конвейеров обработки больших данных. Разработан на Java фондом Apache Software Foundation.

Состоит из модулей:

  • Common — для связи в единое целое других компонентов.
  • HDFS — распределённая файловая система.
  • YARN — планирование заданий и управление кластером.
  • MapReduce — платформа программирования и выполнения распределённых MapReduce-вычислений.

Преимущества Hadoop:

  • Надежность.
  • Маштабируемость.
  • Отказоустойчивость.
  • Портируемость.

Подробнее о Hadoop на Википедии.

Встречается в статьях

Мини-инструкции:

  1. Как установить и настроить кластер Hadoop на Linux Ubuntu


Дмитрий Моск
— IT-специалист.
Настройка серверов, услуги DevOps.

Другие термины

Блог   Prometheus   Кодек   Patroni   MTU   Реестр Windows   NGINX   Consul   Proxmox VE   MariaDB   Flussonic Media Server   Аккаунт   WPS   Процессор   NTFS   Ceph   Gradle   RAID   Samba   DKIM  
.....

Реклама