Разлика между RDBMS и Hadoop

Съдържание:

Разлика между RDBMS и Hadoop
Разлика между RDBMS и Hadoop

Видео: Разлика между RDBMS и Hadoop

Видео: Разлика между RDBMS и Hadoop
Видео: Hadoop. Введение в Big Data и MapReduce 2024, Юли
Anonim

Ключовата разлика между RDBMS и Hadoop е, че RDBMS съхранява структурирани данни, докато Hadoop съхранява структурирани, полуструктурирани и неструктурирани данни.

RDBMS е система за управление на база данни, базирана на релационния модел. Hadoop е софтуер за съхраняване на данни и стартиране на приложения на клъстери от стандартен хардуер.

Образ
Образ

Какво е RDBMS?

RDBMS означава Система за управление на релационни бази данни, базирана на релационния модел. В RDBMS таблиците се използват за съхраняване на данни, а ключовете и индексите помагат за свързването на таблиците. Таблицата е колекция от елементи от данни и те са обектите. Съдържа редове и колони. Редовете представляват един запис в таблицата. Колоните представляват атрибутите.

Например, базата данни за продажби може да има обекти на клиенти и продукти. Клиентът може да има атрибути като customer_id, name, address, phone_no. Елементът може да има атрибути като product_id, име и т.н. Първичният ключ на таблицата на клиента е customer_id, докато първичният ключ на таблицата на продукта е product_id. Поставянето на product_id в таблицата на клиента като външен ключ свързва тези два обекта. По същия начин таблиците също са свързани една с друга. Те осигуряват цялост на данните, нормализиране и много други. Малко от често срещаните RDBMS са MySQL, MSSQL и Oracle. Те използват SQL за заявки.

Какво е Hadoop?

Hadoop е рамка с отворен код на Apache, написана на Java. Той помага да се съхранява и обработва голямо количество данни в клъстери от компютри, като се използват прости модели за програмиране. Основната цел на Hadoop е да съхранява и обработва Big Data, което се отнася до голямо количество сложни данни. Пропускателната способност на Hadoop, която е капацитетът за обработка на обем от данни за определен период от време, е висока.

Разлика между RDBMS и Hadoop
Разлика между RDBMS и Hadoop

Има четири модула в архитектурата на Hadoop. Те са Hadoop common, YARN, Hadoop Distributed File System (HDFS) и Hadoop MapReduce. Общият модул съдържа Java библиотеки и помощни програми. Освен това има файловете за стартиране на Hadoop. Hadoop YARN изпълнява планирането на задачи и управлението на ресурсите на клъстера.

Освен това, разпределената файлова система Hadoop (HDFS) е системата за съхранение на Hadoop. Той използва архитектурата master-slave. Главният възел е NameNode и той управлява метаданните на файловата система. Други компютри са подчинени възли или DataNodes. Те съхраняват действителните данни. От друга страна, Hadoop MapReduce прави разпределеното изчисление. Има алгоритми за обработка на данните. В HDFS главният възел има инструмент за проследяване на задачи. Той изпълнява задачи за намаляване на картата на подчинените възли. Има Task Tracker за всеки подчинен възел, за да завърши обработката на данни и да изпрати резултата обратно към главния възел. Като цяло Hadoop осигурява масивно съхранение на данни с висока мощност на обработка.

Каква е разликата между RDBMS и Hadoop?

RDBMS срещу Hadoop

RDBMS е системен софтуер за създаване и управление на бази данни, базирани на релационния модел. Hadoop е колекция от софтуер с отворен код, който свързва много компютри за решаване на проблеми, включващи голямо количество данни и изчисления.
Разновидност на данните
RDBMS съхранява структурирани данни. Hadoop съхранява структурирани, полуструктурирани и неструктурирани данни.
Съхранение на данни
RDBMS съхранява средно количество данни. Hadoop съхранява голямо количество данни от RDBMS.
Скорост
В RDBMS четенията са бързи. В Hadoop четенето и записът са бързи.
Мащабируемост
RDBMS има вертикална мащабируемост. Hadoop има хоризонтална мащабируемост.
Хардуер
RDBMS използват сървъри от висок клас. Hadoop използва стандартен хардуер.
Пропускателна способност
Пропускателната способност на RDBMS е по-висока. Пропускателната способност на Hadoop е по-ниска.

Резюме – RDBMS срещу Hadoop

Тази статия обсъждаше разликата между RDBMS и Hadoop. Ключовата разлика между RDBMS и Hadoop е, че RDBMS съхранява структурирани данни, докато Hadoop съхранява структурирани, полуструктурирани и неструктурирани данни.

Препоръчано: