ключевое отличие между RDBMS и Hadoop является то, что СУБД хранит структурированные данные, в то время как Hadoop хранит структурированные, полуструктурированные и неструктурированные данные.
СУБД - это система управления базами данных, основанная на реляционной модели. Hadoop - это программное обеспечение для хранения данных и запуска приложений на кластерах стандартного оборудования..
1. Обзор и основные отличия
2. Что такое СУБД
3. Что такое Hadoop
4. Сравнение бок о бок - СУБД против Hadoop в табличной форме
5. Резюме
RDBMS расшифровывается как система управления реляционными базами данных на основе реляционной модели. В СУБД таблицы используются для хранения данных, а ключи и индексы помогают соединять таблицы. Таблица представляет собой набор элементов данных, и они являются сущностями. Содержит строки и столбцы. Строки представляют одну запись в таблице. Столбцы представляют атрибуты.
Например, в базе данных продаж могут быть сущности клиента и продукта. У клиента могут быть такие атрибуты, как customer_id, имя, адрес, phone_no. Элемент может иметь такие атрибуты, как product_id, name и т. Д. Первичный ключ таблицы customer - customer_id, а первичный ключ таблицы product - product_id. Размещение product_id в таблице клиентов в качестве внешнего ключа связывает эти две сущности. Кроме того, таблицы также связаны друг с другом. Они обеспечивают целостность данных, нормализацию и многое другое. Немногие из распространенных СУБД - MySQL, MSSQL и Oracle. Они используют SQL для запросов.
Hadoop - это платформа с открытым исходным кодом Apache, написанная на Java. Это помогает хранить и обрабатывать большое количество данных на кластерах компьютеров, используя простые модели программирования. Основная задача Hadoop - хранить и обрабатывать большие данные., что относится к большому количеству сложных данных. Пропускная способность Hadoop, которая является способностью обрабатывать объем данных в течение определенного периода времени, является высокой.
В архитектуре Hadoop есть четыре модуля. Это Hadoop common, YARN, распределенная файловая система Hadoop (HDFS) и Hadoop MapReduce. Общий модуль содержит библиотеки и утилиты Java. Он также имеет файлы для запуска Hadoop. Hadoop YARN выполняет планирование заданий и управление ресурсами кластера..
Кроме того, распределенная файловая система Hadoop (HDFS) является системой хранения Hadoop. Он использует архитектуру master-slave. Главный узел - это NameNode, он управляет метаданными файловой системы. Другие компьютеры являются подчиненными узлами или узлами данных. Они хранят фактические данные. С другой стороны, Hadoop MapReduce выполняет распределенные вычисления. У него есть алгоритмы для обработки данных. В HDFS мастер-узел имеет систему отслеживания заданий. Он запускает карту сокращения заданий на подчиненных узлах. Для каждого подчиненного узла имеется трекер задач, который завершает обработку данных и отправляет результат обратно в главный узел. В целом, Hadoop обеспечивает массивное хранение данных с высокой вычислительной мощностью.
СУБД против Hadoop | |
RDBMS - это системное программное обеспечение для создания и управления базами данных, основанное на реляционной модели. | Hadoop представляет собой набор программного обеспечения с открытым исходным кодом, который соединяет множество компьютеров для решения проблем, связанных с большим объемом данных и вычислений. |
Разнообразие данных | |
СУБД хранит структурированные данные. | Hadoop хранит структурированные, полуструктурированные и неструктурированные данные. |
Хранилище данных | |
СУБД хранит среднее количество данных. | Hadoop хранит большой объем данных, чем RDBMS. |
скорость | |
В СУБД чтения быстро. | В Hadoop чтение и запись выполняются быстро. |
Масштабируемость | |
СУБД имеет вертикальную масштабируемость. | Hadoop имеет горизонтальную масштабируемость. |
аппаратные средства | |
СУБД используют высокопроизводительные серверы. | Hadoop использует товарное оборудование. |
пропускная способность | |
Пропускная способность СУБД выше. | Пропускная способность Hadoop ниже. |
В этой статье обсуждалась разница между RDBMS и Hadoop. Основное различие между RDBMS и Hadoop состоит в том, что RDBMS хранит структурированные данные, в то время как Hadoop хранит структурированные, полуструктурированные и неструктурированные данные..
1. Учебное пособие. «Концепции СУБД SQL» , Tutorials Point, 8 января 2018 года. Доступно здесь
2. Учебное пособие. «Учебник по Hadoop» , Tutorials Point, 8 января 2018 года. Доступно здесь
1.'8552968000'в Intel Free Press (CC BY-SA 2.0) через Flickr