Извличане на данни срещу инструменти за заявки
Инструментите за заявки са инструменти, които помагат за анализиране на данните в база данни. Те осигуряват функции за изграждане на заявки, редактиране на заявки, търсене, намиране, докладване и обобщаване. От друга страна, извличането на данни е област в компютърните науки, която се занимава с извличането на неизвестна преди това и интересна информация от необработени данни. Данните, използвани като вход за процеса на извличане на данни, обикновено се съхраняват в бази данни. Потребителите, които са склонни към статистика, използват Data Mining. Те използват статистически модели, за да търсят скрити модели в данните. Копачите на данни се интересуват от намирането на полезни връзки между различни елементи от данни, което в крайна сметка е печелившо за бизнеса.
Извличане на данни
Извличането на данни е известно още като откриване на знания в данни (KDD). Както бе споменато по-горе, това е област на компютърните науки, която се занимава с извличането на неизвестна преди това и интересна информация от необработени данни. Поради експоненциалния растеж на данните, особено в области като бизнеса, извличането на данни се превърна във много важен инструмент за преобразуване на това голямо богатство от данни в бизнес разузнаване, тъй като ръчното извличане на модели стана изглежда невъзможно през последните няколко десетилетия. Например, в момента се използва за различни приложения като анализ на социални мрежи, откриване на измами и маркетинг. Извличането на данни обикновено се занимава със следните четири задачи: групиране, класификация, регресия и асоцииране. Клъстерирането е идентифициране на подобни групи от неструктурирани данни. Класификацията е правила за обучение, които могат да бъдат приложени към нови данни и обикновено ще включва следните стъпки: предварителна обработка на данни, проектиране на моделиране, обучение/избор на характеристики и оценка/валидиране. Регресията е намиране на функции с минимална грешка за моделиране на данни. А асоциацията търси връзки между променливи. Извличането на данни обикновено се използва, за да се отговори на въпроси като кои са основните продукти, които могат да помогнат за получаване на висока печалба през следващата година в Wal-Mart?
Инструменти за заявки
Инструментите за заявки са инструменти, които помагат да се анализират данните в база данни. Обикновено тези инструменти за заявки имат GUI преден край с удобни начини за въвеждане на заявки като набор от атрибути. След като тези входове бъдат предоставени, инструментът генерира действителни заявки, съставени от основния език за заявки, използван от базата данни. SQL, T-SQL и PL/SQL са примери за езици за заявки, използвани в много популярни бази данни днес. След това тези генерирани заявки се изпълняват спрямо базите данни и резултатите от заявките се представят или докладват на потребителя по организиран и ясен начин. Обикновено потребителят не трябва да знае специфичен за базата данни език за заявки, за да използва инструмент за заявки. Основните характеристики на инструментите за заявки са интегриран конструктор и редактор на заявки, летни отчети и цифри, функции за импортиране и експортиране и разширени възможности за намиране/търсене.
Каква е разликата между Data mining и Query Tools?
Инструментите за заявки могат да се използват за лесно създаване и въвеждане на заявки към бази данни. Инструментите за заявки правят много лесно създаването на заявки, без дори да се налага да изучавате специфичен за базата данни език за заявки. От друга страна, Data Mining е техника или концепция в компютърните науки, която се занимава с извличане на полезна и неизвестна преди това информация от необработени данни. В повечето случаи тези необработени данни се съхраняват в много големи бази данни. Следователно Data miners могат да използват съществуващите функционалности на Query Tools за предварителна обработка на необработени данни преди процеса на Data mining. Въпреки това, основната разлика между техниките за извличане на данни и използването на инструменти за заявки е, че за да използват инструменти за заявки, потребителите трябва да знаят точно какво търсят, докато извличането на данни се използва най-вече, когато потребителят има неясна представа за това, което искат търсят.