Разница между СУБД и Hadoop

ключевое отличие между RDBMS и Hadoop является то, что СУБД хранит структурированные данные, в то время как Hadoop хранит структурированные, полуструктурированные и неструктурированные данные.

СУБД - это система управления базами данных, основанная на реляционной модели. Hadoop - это программное обеспечение для хранения данных и запуска приложений на кластерах стандартного оборудования..

СОДЕРЖАНИЕ

1. Обзор и основные отличия
2. Что такое СУБД
3. Что такое Hadoop
4. Сравнение бок о бок - СУБД против Hadoop в табличной форме
5. Резюме

Что такое СУБД?

RDBMS расшифровывается как система управления реляционными базами данных на основе реляционной модели. В СУБД таблицы используются для хранения данных, а ключи и индексы помогают соединять таблицы. Таблица представляет собой набор элементов данных, и они являются сущностями. Содержит строки и столбцы. Строки представляют одну запись в таблице. Столбцы представляют атрибуты.

Например, в базе данных продаж могут быть сущности клиента и продукта. У клиента могут быть такие атрибуты, как customer_id, имя, адрес, phone_no. Элемент может иметь такие атрибуты, как product_id, name и т. Д. Первичный ключ таблицы customer - customer_id, а первичный ключ таблицы product - product_id. Размещение product_id в таблице клиентов в качестве внешнего ключа связывает эти две сущности. Кроме того, таблицы также связаны друг с другом. Они обеспечивают целостность данных, нормализацию и многое другое. Немногие из распространенных СУБД - MySQL, MSSQL и Oracle. Они используют SQL для запросов.

Что такое Hadoop?

Hadoop - это платформа с открытым исходным кодом Apache, написанная на Java. Это помогает хранить и обрабатывать большое количество данных на кластерах компьютеров, используя простые модели программирования. Основная задача Hadoop - хранить и обрабатывать большие данные., что относится к большому количеству сложных данных. Пропускная способность Hadoop, которая является способностью обрабатывать объем данных в течение определенного периода времени, является высокой.

В архитектуре Hadoop есть четыре модуля. Это Hadoop common, YARN, распределенная файловая система Hadoop (HDFS) и Hadoop MapReduce. Общий модуль содержит библиотеки и утилиты Java. Он также имеет файлы для запуска Hadoop. Hadoop YARN выполняет планирование заданий и управление ресурсами кластера..

Кроме того, распределенная файловая система Hadoop (HDFS) является системой хранения Hadoop. Он использует архитектуру master-slave. Главный узел - это NameNode, он управляет метаданными файловой системы. Другие компьютеры являются подчиненными узлами или узлами данных. Они хранят фактические данные. С другой стороны, Hadoop MapReduce выполняет распределенные вычисления. У него есть алгоритмы для обработки данных. В HDFS мастер-узел имеет систему отслеживания заданий. Он запускает карту сокращения заданий на подчиненных узлах. Для каждого подчиненного узла имеется трекер задач, который завершает обработку данных и отправляет результат обратно в главный узел. В целом, Hadoop обеспечивает массивное хранение данных с высокой вычислительной мощностью.

В чем разница между RDBMS и Hadoop?

СУБД против Hadoop

RDBMS - это системное программное обеспечение для создания и управления базами данных, основанное на реляционной модели. Hadoop представляет собой набор программного обеспечения с открытым исходным кодом, который соединяет множество компьютеров для решения проблем, связанных с большим объемом данных и вычислений.
 Разнообразие данных
СУБД хранит структурированные данные. Hadoop хранит структурированные, полуструктурированные и неструктурированные данные.
Хранилище данных
СУБД хранит среднее количество данных. Hadoop хранит большой объем данных, чем RDBMS.
 скорость
В СУБД чтения быстро. В Hadoop чтение и запись выполняются быстро.
Масштабируемость
СУБД имеет вертикальную масштабируемость. Hadoop имеет горизонтальную масштабируемость.
аппаратные средства
СУБД используют высокопроизводительные серверы. Hadoop использует товарное оборудование.
  пропускная способность
Пропускная способность СУБД выше. Пропускная способность Hadoop ниже.

Резюме - СУБД против Hadoop

В этой статье обсуждалась разница между RDBMS и Hadoop. Основное различие между RDBMS и Hadoop состоит в том, что RDBMS хранит структурированные данные, в то время как Hadoop хранит структурированные, полуструктурированные и неструктурированные данные..

Ссылка:

1. Учебное пособие. «Концепции СУБД SQL» , Tutorials Point, 8 января 2018 года. Доступно здесь  
2. Учебное пособие. «Учебник по Hadoop» , Tutorials Point, 8 января 2018 года. Доступно здесь  

Изображение предоставлено:

1.'8552968000'в Intel Free Press (CC BY-SA 2.0) через Flickr