Ключовата разлика между класификацията и регресионното дърво е, че при класификацията зависимите променливи са категорични и неподредени, докато при регресията зависимите променливи са непрекъснати или подредени цели стойности.
Класификацията и регресията са техники за обучение за създаване на модели на прогнозиране от събрани данни. И двете техники са представени графично като класификационни и регресионни дървета, или по-скоро блок-схеми с разделение на данни след всяка стъпка, или по-скоро „клон“в дървото. Този процес се нарича рекурсивно разделяне. Полета като Mining използват тези техники за класификация и регресионно обучение. Тази статия се фокусира върху дървото на класификацията и дървото на регресията.
Какво е класификация?
Класификацията е техника, използвана за постигане на схема, която показва организацията на данните, започвайки с прекурсорна променлива. Зависимите променливи са това, което класифицира данните.
Фигура 01: Извличане на данни
Класификационното дърво започва с независимата променлива, която се разклонява на две групи, определени от съществуващите зависими променливи. Той има за цел да изясни отговорите под формата на категоризация, предизвикана от зависимите променливи.
Какво е регресия
Регресията е метод за прогнозиране, който се основава на предполагаема или известна числена изходна стойност. Тази изходна стойност е резултат от поредица от рекурсивни разделяния, като всяка стъпка има една числена стойност и друга група от зависими променливи, които се разклоняват към друга двойка като тази.
Регресионното дърво започва с една или повече прекурсорни променливи и завършва с една крайна изходна променлива. Зависимите променливи са или непрекъснати, или дискретни числови променливи.
Каква е разликата между класификация и регресия?
Класификация срещу регресия |
|
Дървовиден модел, при който целевата променлива може да приема дискретен набор от стойности. | Дървовиден модел, при който целевата променлива може да приема непрекъснати стойности, обикновено реални числа. |
Зависима променлива | |
За класификационното дърво зависимите променливи са категорични. | За регресионно дърво зависимите променливи са числени. |
Ценности | |
Има зададено количество неподредени стойности. | Има или дискретни, но подредени стойности, или недискретни стойности. |
Цел на строителството | |
Целта на конструирането на регресионното дърво е да се напасне регресионна система към всеки детерминантен клон по начин, по който се получава очакваната изходна стойност. | Класификационното дърво се разклонява, както е определено от зависима променлива, извлечена от предишния възел. |
Обобщение – Класификация срещу регресия
Регресионните и класификационни дървета са полезни техники за начертаване на процеса, който сочи към изследван резултат, независимо дали в класификация или единична числена стойност. Разликата между класификационното дърво и регресионното дърво е тяхната зависима променлива. Класификационните дървета имат зависими променливи, които са категорични и неподредени. Регресионните дървета имат зависими променливи, които са непрекъснати стойности или подредени цели стойности.