Разлика между СУБД и извличане на данни

Разлика между СУБД и извличане на данни
Разлика между СУБД и извличане на данни

Видео: Разлика между СУБД и извличане на данни

Видео: Разлика между СУБД и извличане на данни
Видео: Мультики про машинки новые серии 2017 - Кто сильнее! Лучшие мультфильмы для детей /#мультик игра 2024, Юли
Anonim

СУБД срещу извличане на данни

СУБД (Система за управление на бази данни) е цялостна система, използвана за управление на цифрови бази данни, която позволява съхранение на съдържание на база данни, създаване/поддържане на данни, търсене и други функции. От друга страна, Data Mining е област в компютърните науки, която се занимава с извличането на неизвестна преди това и интересна информация от необработени данни. Обикновено данните, използвани като вход за процеса на извличане на данни, се съхраняват в бази данни. Потребителите, които са склонни към статистика, използват Data Mining. Те използват статистически модели, за да търсят скрити модели в данните. Копачите на данни се интересуват от намирането на полезни връзки между различни елементи от данни, което в крайна сметка е печелившо за бизнеса.

DBMS

СУБД, понякога наричана просто мениджър на база данни, е колекция от компютърни програми, предназначени за управление (т.е. организация, съхранение и извличане) на всички бази данни, които са инсталирани в система (т.е. твърд диск или мрежа). В света съществуват различни видове системи за управление на бази данни и някои от тях са предназначени за правилно управление на бази данни, конфигурирани за конкретни цели. Най-популярните търговски системи за управление на бази данни са Oracle, DB2 и Microsoft Access. Всички тези продукти предоставят средства за разпределяне на различни нива на привилегии за различни потребители, което прави възможно СУБД да се контролира централно от един администратор или да бъде разпределена на няколко различни хора. Има четири важни елемента във всяка система за управление на бази данни. Те са езикът за моделиране, структурите от данни, езикът за заявки и механизмът за транзакции. Езикът за моделиране дефинира езика на всяка база данни, хоствана в СУБД. В момента на практика са няколко популярни подхода като йерархичен, мрежов, релационен и обектен. Структурите на данни помагат за организирането на данните като индивидуални записи, файлове, полета и техните дефиниции и обекти като визуални медии. Езикът за заявка на данни поддържа сигурността на базата данни чрез наблюдение на данните за влизане, правата за достъп на различни потребители и протоколите за добавяне на данни към системата. SQL е популярен език за заявки, който се използва в системите за управление на релационни бази данни. И накрая, механизмът, който позволява транзакции, помага за паралелността и множеството. Този механизъм ще гарантира, че един и същ запис няма да бъде модифициран от множество потребители едновременно, като по този начин ще запази целостта на данните. Освен това, СУБД осигуряват резервно копие и други съоръжения.

Извличане на данни

Извличането на данни е известно още като откриване на знания в данни (KDD). Както бе споменато по-горе, това е фелид на компютърните науки, който се занимава с извличането на неизвестна преди това и интересна информация от необработени данни. Поради експоненциалния растеж на данните, особено в области като бизнеса, извличането на данни се превърна във много важен инструмент за преобразуване на това голямо богатство от данни в бизнес разузнаване, тъй като ръчното извличане на модели стана изглежда невъзможно през последните няколко десетилетия. Например, в момента се използва за различни приложения като анализ на социални мрежи, откриване на измами и маркетинг. Извличането на данни обикновено се занимава със следните четири задачи: групиране, класификация, регресия и асоцииране. Клъстерирането е идентифициране на подобни групи от неструктурирани данни. Класификацията е правила за обучение, които могат да бъдат приложени към нови данни и обикновено ще включва следните стъпки: предварителна обработка на данни, проектиране на моделиране, обучение/избор на характеристики и оценка/валидиране. Регресията е намиране на функции с минимална грешка за моделиране на данни. А асоциацията търси връзки между променливи. Извличането на данни обикновено се използва, за да се отговори на въпроси като кои са основните продукти, които могат да помогнат за получаване на висока печалба през следващата година в Wal-Mart?

Каква е разликата между СУБД и извличане на данни?

DBMS е пълноценна система за съхранение и управление на набор от цифрови бази данни. Извличането на данни обаче е техника или концепция в компютърните науки, която се занимава с извличане на полезна и неизвестна преди това информация от необработени данни. В повечето случаи тези необработени данни се съхраняват в много големи бази данни. Следователно Data miners използват съществуващите функционалности на СУБД за обработка, управление и дори предварителна обработка на необработени данни преди и по време на процеса на Data mining. Само една СУБД обаче не може да се използва за анализ на данни. Но някои СУБД в момента имат вградени инструменти или възможности за анализ на данни.

Препоръчано: