Что такое Hadoop

Обновлено и опубликовано Опубликовано:

Hadoop —
простыми словами

набор инструментов для разработки программ и обеспечения среды для их запуска в распределенной среде. Позволяет создавать большие кластеры и упрощает процесс управления ими. Является одним из элементов конвейеров обработки больших данных. Разработан на Java фондом Apache Software Foundation.

Состоит из модулей:

  • Common — для связи в единое целое других компонентов.
  • HDFS — распределённая файловая система.
  • YARN — планирование заданий и управление кластером.
  • MapReduce — платформа программирования и выполнения распределённых MapReduce-вычислений.

Преимущества Hadoop:

  • Надежность.
  • Маштабируемость.
  • Отказоустойчивость.
  • Портируемость.

Подробнее о Hadoop на Википедии.

Встречается в статьях

Мини-инструкции:

  1. Как установить и настроить кластер Hadoop на Linux Ubuntu
Дмитрий Моск
— IT-специалист.
Настройка серверов, компьютерная помощь.

Другие термины

ISA Server   UEFI   OpenVZ   Hashicorp Vault   Ошибка 404   Redmine   Blu-Ray   Nextcloud   Consul   PTR-запись   Jenkins   OpenVPN   MariaDB   Mikrotik   Безопасный режим   Ubuntu   RAID   S.M.A.R.T.   Git   FAT  
.....

Реклама