Категорични данни срещу числени данни
Данните са фактите или информацията, събрана за справка или анализ. Често тези данни се събират като атрибут на съответния субект. Този атрибут може да варира от един на друг, следователно този променлив атрибут може да се счита за променлива. Променливите могат да приемат различни форми на стойности и те са присъщи на събраните данни.
Променливите могат да бъдат качествени или количествени; т.е. ако променливата е количествена, отговорите са числа и величината на измерения атрибут може да бъде заявена с известна степен на точност. Другият тип, качествените променливи, измерват качествените атрибути и стойностите, приети от променливите, не могат да бъдат дадени като размер или величина. Самите променливи са известни като категориални променливи и данните, събрани с помощта на категориална променлива, са категорични данни.
Повече за цифровите данни
Числовите данни са основно количествените данни, получени от променлива, а стойността има смисъл на размер/величина. Получените числени данни са допълнително разделени в още три категории въз основа на теорията, разработена от Стенли Смит Стивънс. Числените данни могат да бъдат порядъчни, интервални или съотношителни. Типът на данните се определя от метода на измерване на стойностите и типовете са известни като нива на измерване.
Теглото на човек, разстоянието между две точки, температурата и цената на акции са примери за числови данни.
В статистиката по-голямата част от методите се извличат за анализ на числени данни. Основна описателна статистика и регресия и други инференциални методи се използват главно за анализ на числени данни.
Повече за категоричните данни
Категоричните данни са стойности за качествена променлива, често число, дума или символ. Те показват факта, че променливата в разглеждания случай принадлежи към един от няколкото налични избора. Следователно те принадлежат към една от категориите; оттук и името категорично.
Политическата принадлежност на дадено лице, националността на дадено лице, любимият цвят на дадено лице и кръвната група на даден пациент са качествени атрибути. Понякога може да се получи число като категорична стойност, но самото число не представлява величината на измерения атрибут. Пощенският код е един пример.
Също така, всички категорични стойности принадлежат към номиналния тип данни, който е друг тип, базиран на нивата на измерванията. Методите, използвани за анализиране на категорични данни, са различни от тези на числените данни, но основният принцип може да е същият.
Каква е разликата между категориалните и числените данни?
• Числените данни са стойности, получени за количествена променлива, и носят усещане за величина, свързано с контекста на променливата (следователно те винаги са числа или символи, носещи числена стойност). Категоричните данни са стойности, получени за качествена променлива; числата на категоричните данни не носят усещане за величина.
• Числовите данни винаги принадлежат към порядъчен, съотношен или интервален тип, докато категориалните данни принадлежат към номинален тип.
• Методите, използвани за анализиране на количествени данни, са различни от методите, използвани за категорични данни, дори ако принципите са същите, поне приложението има значителни разлики.
• Числените данни се анализират с помощта на статистически методи в описателна статистика, регресия, времеви редове и много други.
• За категориални данни обикновено се използват описателни методи и графични методи. Използват се и някои непараметрични тестове.