Категориальные данные против числовых данных
Данные - это факты или информация, собранная с целью ссылки или анализа. Часто эти данные собираются как атрибут соответствующего субъекта. Этот атрибут может варьироваться от одного к другому, поэтому этот изменяющийся атрибут можно рассматривать как переменную. Переменные могут принимать разные формы значений, и они являются неотъемлемой частью собранных данных..
Переменные могут быть качественными или количественными; то есть, если переменная является количественной, ответы являются числами, и величина измеренного атрибута может быть указана с определенной степенью точности. Другой тип, качественные переменные, измеряют качественные атрибуты, и значения, принятые переменными, не могут быть даны с точки зрения размера или величины. Сами переменные известны как категориальные переменные, а данные, собранные с помощью категориальной переменной, являются категориальными данными..
Подробнее о числовых данных
Числовые данные - это, в основном, количественные данные, полученные из переменной, и значение имеет значение размера / величины. Полученные числовые данные далее подразделяются на еще три категории на основе теории, разработанной Стэнли Смитом Стивенсом. Числовые данные могут быть порядковыми, интервальными или отношениями. Тип данных определяется методом измерения значений, а типы называются уровнями измерения..
Вес человека, расстояние между двумя точками, температура и цена акции являются примерами числовых данных..
В статистике большинство методов выводится для анализа числовых данных. Базовая описательная статистика, регрессия и другие логические методы в основном используются для анализа числовых данных..
Подробнее о категориальных данных
Категориальными данными являются значения качественной переменной, часто числа, слова или символа. Они выявляют тот факт, что переменная в рассматриваемом случае принадлежит к одному из нескольких доступных вариантов. Поэтому они относятся к одной из категорий; отсюда и название категоричное.
Политическая принадлежность человека, его национальность, его любимый цвет и группа крови являются качественными признаками. Иногда число может быть получено как категориальное значение, но само число не представляет величину измеренного атрибута. Почтовый индекс является одним из примеров.
Кроме того, любые категориальные значения принадлежат номинальному типу данных, который является другим типом, основанным на уровнях измерений. Методы, используемые для анализа категориальных данных, отличаются от числовых данных, но основной принцип может быть таким же.
В чем разница между категориальными и числовыми данными?
• Числовые данные представляют собой значения, полученные для количественной переменной, и несут смысл величины, связанной с контекстом переменной (следовательно, они всегда являются числами или символами, несущими числовое значение). Категориальными данными являются значения, полученные для качественной переменной; номера категорийных данных не имеют смысла.
• Числовые данные всегда относятся к порядковому типу, коэффициенту или интервальному типу, тогда как категориальные данные относятся к номинальному типу..
• Методы, используемые для анализа количественных данных, отличаются от методов, используемых для категориальных данных, даже если принципы совпадают, по крайней мере, приложение имеет значительные различия.
• Числовые данные анализируются с использованием статистических методов в описательной статистике, регрессии, временных рядах и многих других..
• Для категориальных данных обычно используются описательные методы и графические методы. Некоторые непараметрические тесты также используются.