Разница между T-TEST и ANOVA

Т-ТЕСТ против АНОВА

Сбор и вычисление статистических данных для получения среднего значения часто является длительным и утомительным процессом. T-критерий и односторонний дисперсионный анализ (ANOVA) являются двумя наиболее распространенными тестами, используемыми для этой цели..

T-критерий представляет собой статистический тест гипотезы, где статистика теста соответствует распределению t Стьюдента, если поддерживается нулевая гипотеза. Этот тест применяется, когда статистика теста соответствует нормальному распределению, и значение масштабирующего члена в статистике теста известно. Если срок масштабирования неизвестен, он заменяется оценкой, основанной на доступных данных. Статистика теста будет соответствовать t-распределению студента.

Уильям Сили Госсет ввел t-статистику в 1908 году. Госсет был химиком пивоваренного завода Guinness в Дублине, Ирландия. Пивоваренный завод Guinness проводил политику набора лучших выпускников из Оксфорда и Кембриджа, отбирая из тех, кто мог бы предоставить приложения биохимии и статистики для устоявшихся производственных процессов компании. Уильям Сили Госсет был одним из таких выпускников. В ходе этого процесса Уильям Сили Госсет разработал t-тест, который изначально предполагался как способ контроля качества стаута (темного пива, производимого пивоварней) экономически эффективным способом. Госсет опубликовал тест под псевдонимом «Студент» в Биометрике, около 1908 года. Причиной для псевдонима было настойчивость Гиннесса, так как компания хотела сохранить свою политику использования статистики как части своих «коммерческих секретов»..

Статистика T-теста обычно имеет вид T = Z / s, где Z и s являются функциями данных. Переменная Z предназначена для чувствительности к альтернативной гипотезе; эффективно, величина Z-переменной больше, когда альтернативная гипотеза верна. В то же время «s» - это параметр масштабирования, позволяющий определить распределение T. Предположения, лежащие в основе t-критерия: а) Z следует стандартному нормальному распределению при нулевой гипотезе; б) ps2 следует распределению Ï ‡ 2 с p степенями свободы при нулевой гипотезе (где p - положительная постоянная); и c) значение Z и значение s являются независимыми. В определенном типе t-критерия эти условия являются следствием исследуемой совокупности, а также способом отбора данных..

С другой стороны, дисперсионный анализ (ANOVA) представляет собой набор статистических моделей. Хотя принципы ANOVA использовались исследователями и статистиками в течение длительного времени, только в 1918 году сэр Рональд Фишер сделал предложение формализовать дисперсионный анализ в статье под названием «Корреляция между родственниками в предположении о менделевском наследовании». , С тех пор ANOVA была расширена в своем объеме и области применения. ANOVA на самом деле является неправильным, так как он основан не на различиях в отклонениях, а на различиях между группами. Он включает в себя соответствующие процедуры, в которых наблюдаемое отклонение в конкретной переменной разбивается на компоненты, относящиеся к различным источникам изменчивости..

По сути, ANOVA предоставляет статистический тест для определения того, равны ли средние значения нескольких групп, и, как результат, обобщает t-тест для более чем двух групп. ANOVA может быть более полезным, чем t-тест с двумя выборками, поскольку он имеет меньшую вероятность совершения ошибки типа I. Например, наличие нескольких t-тестов из двух выборок будет иметь большую вероятность совершения ошибки, чем ANOVA с теми же переменными, которые используются для получения среднего значения. Модель такая же, а статистика теста - это коэффициент F. Проще говоря, t-тесты - это особый случай ANOVA: выполнение ANOVA будет иметь тот же результат, что и множественные t-тесты. Существует три класса моделей ANOVA: a) модели с фиксированными эффектами, которые предполагают, что данные поступают от нормальных групп населения, отличающихся только по средствам; б) Модели случайных эффектов, предполагающие, что данные описывают иерархию различных групп населения, различия которых ограничены иерархией; и c) модели смешанных эффектов, которые представляют собой ситуации, в которых присутствуют как фиксированные, так и случайные эффекты..

Резюме:

  1.  T-критерий используется при определении того, являются ли два средних или средних одинаковыми или разными. ANOVA является предпочтительным при сравнении трех или более средних или средних.
  2.  Т-тест имеет больше шансов на ошибку, чем больше средств используется, поэтому ANOVA используется при сравнении двух или более средств.