Классификация против табуляции
Как классификация, так и табулирование являются методами суммирования данных в статистике, что делает дальнейший анализ данных, чтобы сделать выводы из данных. В этой статье мы подробно обсудим два метода обобщения данных и проведем различие между классификацией и табулированием данных..
Что такое классификация данных?
В статистике классификация - это процесс разделения данных на несколько классов или групп с использованием свойств в наборе данных. Например, результаты теста по математике в классе можно разделить на две группы по полу. Такая классификация объединяет необработанные данные в подходящие формы для статистического анализа и удаляет сложные шаблоны данных и выделяет основных представителей необработанных данных. После классификации можно сделать сравнения и сделать выводы. Секретные данные могут также предоставлять отношения или коррелятивные шаблоны данных.
Необработанные данные классифицируются с использованием четырех ключевых характеристик, таких как географические, хронологические, качественные и количественные характеристики. Рассмотрим набор данных, собранных для анализа доходов работников по всему миру. Например, доход среднего работника может быть классифицирован на основе страны работника, где географический фактор является метрикой для классификации. Это также может быть классифицировано на основе хронологических свойств, таких как возраст работника. Профессия каждого работника также обеспечивает качественную базу для классификации, а диапазоны заработной платы могут использоваться в качестве количественной базы для классификации.
Что такое табулирование данных?
В статистике табулирование - это метод суммирования данных, использующий систематическое расположение данных в строках и столбцах. Табулирование проводится с целью проведения исследования, для сравнения, чтобы выявить ошибки и упущения в данных, изучить преобладающую тенденцию, упростить необработанные данные, экономно использовать пространство и использовать его в качестве справочного материала в будущем..
Как правило, статистическая таблица имеет следующие компоненты.
Компонент | Описание |
заглавие | Название представляет собой краткое и четкое объяснение содержания таблицы. |
Номер стола | Номер присваивается таблице для легкой идентификации, когда много таблиц включены. |
Дата | Дата создания таблицы должна быть указана |
Обозначения строк | Каждой строке таблицы присваивается краткое имя, которое обычно указывается в первом столбце. Такое имя известно как «заглушка», а столбец известен как «заглушка» |
Заголовки столбцов | Каждому столбцу присваивается заголовок, объясняющий характер рисунков, включенных в каждый столбец. Такие имена известны как «подписи» или «заголовки». |
Тело стола | Данные вводятся в основную часть и должны быть созданы для легкой идентификации каждого элемента данных. Числовые значения часто упорядочены в порядке возрастания или убывания. |
Единица измерения | Единица измерения значений в теле таблицы должна быть указана. |
источники | Таблицы должны предоставлять первичные и вторичные источники данных под основной частью таблицы.. |
Сноски и ссылки | Дополнение деталей для уточнения содержимого таблицы. |
Исходя из целей таблицы можно разделить на три основные категории.
В чем разница между классификацией и табуляцией?
• При классификации данные разделяются и группируются на основе свойства данных, общих для всех значений..
• В таблицах данные располагаются в столбцы и строки на основе характеристик / свойств или индикаторов..
• В таблицах часто подчеркиваются аспекты представления данных, в то время как классификация используется как средство сортировки данных для дальнейшего анализа..