Разница между средним, медианным и модным

Среднее против Медианы против Мод
 

Среднее значение, медиана и мода являются основными меры центральной тенденции используется в описательной статистике. Они полностью отличаются друг от друга, и случаи, в которых они используются для обобщения данных, также отличаются.

Жадный

Среднее арифметическое представляет собой сумму значений данных, деленную на количество значений данных, т.е..

 

Если данные взяты из выборочного пространства, это называется средним значением выборки (), который является описательной статистикой выборки. Хотя это наиболее часто используемый описательный показатель для выборки, он не является надежной статистикой. Он очень чувствителен к выбросам и колебаниям.

Например, рассмотрим средний доход жителей того или иного города. Поскольку все значения данных суммируются, а затем делятся, доход чрезвычайно богатого человека существенно влияет на среднее значение. Таким образом, средние значения не являются хорошим представлением данных всегда.

Кроме того, в случае переменного сигнала ток, проходящий через элемент, периодически изменяется от положительного направления к отрицательному направлению и наоборот. Если мы возьмем средний ток, проходящий через элемент за один период, он даст 0, что означает, что ток не прошел через элемент, что, очевидно, не соответствует действительности. Следовательно, и в этом случае среднее арифметическое не является хорошей мерой.

Среднее арифметическое является хорошим показателем, когда данные распределены равномерно. Для нормального распределения среднее значение равно моде и медиане. Он также имеет самые низкие остатки при рассмотрении среднеквадратичной ошибки; следовательно, наилучшая описательная мера, когда требуется представлять набор данных одним числом.

медиана

Значения средней точки данных после упорядочения всех значений данных в порядке возрастания определяются как медиана набора данных. Медиана - 2-й квартиль, 5-й дециль и 50-й процентиль.

• Если число наблюдений (точек данных) нечетно, то медиана - это наблюдение точно в середине упорядоченного списка.

• Если число наблюдений (точек данных) является четным, то медиана является средним значением двух средних наблюдений в упорядоченном списке.

Медиана делит наблюдение на две группы; то есть группа (50%) значений выше и группа (50%) значений ниже медианы. Медианы специально используются в искаженных распределениях и представляют данные довольно лучше, чем среднее арифметическое.

Режим

Режим является наиболее часто встречающимся числом в наборе наблюдений. Режим набора данных рассчитывается путем нахождения частоты каждого элемента в наборе.

• Если значение не встречается более одного раза, то в наборе данных нет режима.

• В противном случае любое значение, которое встречается с наибольшей частотой, является режимом набора данных..

В наборе может существовать более 1 режима; следовательно, режим не является уникальной статистикой набора данных. В равномерном распределении есть один режим. Режим дискретного распределения вероятностей - это точка, в которой функция вероятности достигает своей высшей точки. Оказывая сверху толкования, можно сказать, что глобальные максимумы являются режимами.

Рассмотрим применение всех трех мер к следующему набору данных.

ДАННЫЕ: 1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15 , 15

Среднее = (1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15 ) / 25 = 8,12

Медиана = 9 (13-й элемент)

Режим = 9 (частота 9 = 5)

В чем разница между средним значением, медианой и модой?

• Среднее арифметическое - это сумма значений (наблюдений), деленная на количество наблюдений. Это не надежная статистика и сильно зависит от природы нормального распределения в рассматриваемом распределении. Один выброс может вызвать значительный сдвиг среднего значения, дающий относительно вводящие в заблуждение значения. Эта концепция может быть расширена до среднего геометрического, среднего гармонического, среднего взвешенного и т. Д..

• Медиана - это средние значения набора наблюдений, и на них относительно меньше влияют выбросы. Это может дать хорошую оценку в качестве сводной статистики в сильно искаженных случаях.

• Режим - наиболее распространенные значения наблюдений в наборе данных. Если распределение искажено положительно, то мода находится слева от медианы, а если оно отрицательно, мода лежит справа от медианы.

• При положительном перекосе среднее означает право на медиану; если отрицательное отклонение означает, что слева от медианы.

• В нормальном распределении все три, среднее, мода и медиана равны.