Что такое Hadoop

Обновлено и опубликовано Опубликовано:

Hadoop —
простыми словами

набор инструментов для разработки программ и обеспечения среды для их запуска в распределенной среде. Позволяет создавать большие кластеры и упрощает процесс управления ими. Является одним из элементов конвейеров обработки больших данных. Разработан на Java фондом Apache Software Foundation.

Состоит из модулей:

  • Common — для связи в единое целое других компонентов.
  • HDFS — распределённая файловая система.
  • YARN — планирование заданий и управление кластером.
  • MapReduce — платформа программирования и выполнения распределённых MapReduce-вычислений.

Преимущества Hadoop:

  • Надежность.
  • Маштабируемость.
  • Отказоустойчивость.
  • Портируемость.

Подробнее о Hadoop на Википедии.

Встречается в статьях

Мини-инструкции:

  1. Как установить и настроить кластер Hadoop на Linux Ubuntu
Дмитрий Моск
— IT-специалист.
Настройка серверов, компьютерная помощь.

Другие термины

Patroni   PhpMyAdmin   Powershell   XML   Кулер   Битрикс24   Flussonic Media Server   Емайл   WPA   CPanel   LVM   ClamAV   IPSet   Mail.ru   Роутер   Git   Yahoo   IP-адрес   ClickHouse   1С:Предприятие  
.....

Реклама