Среднее арифметическое, гармоническое и геометрическое, медиана, мода и ожидаемое значение случайной величины

Центральная тенденция - это отдельное значение, которое представляет собой центр распределения данных. Это очень важно и является краеугольным камнем многих статистических моделей и теорий, таких как проверка гипотез, доверительные интервалы, алгоритм кластеризации k-mean, нормальное и другие распределения данных и т. д. Наиболее распространенными мерами центральной тенденции являются среднее арифметическое, медиана и мода. В этой статье мы изучим и реализуем следующие основные тенденции в языке программирования Python.

  • Среднее арифметическое
  • Средневзвешенное значение
  • Ожидаемое значение случайной величины
  • Среднее геометрическое
  • Гармоническое среднее
  • медиана
  • Режим

Среднее арифметическое

Среднее арифметическое также называется средним и рассчитывается путем деления суммы наблюдений на общее количество наблюдений. μ используется для среднего значения совокупности, а x̄ используется для среднего значения выборки.

Средневзвешенное значение

Средневзвешенное значение вычисляется путем деления скалярного произведения вектора данных и вектора весов на сумму вектора весов, формула приведена ниже.

Ожидаемое значение случайной величины

  • Создайте векторы значений и частот из вектора данных с помощью np.unique(data, return_counts = True)
  • Вычислите среднее значение путем деления скалярного произведения данных и векторов частоты на вектор частоты
  • Мы также можем рассчитать ожидаемое значение, вычислив вектор вероятности из вектора частот f как p = f/sum(f)
  • Теперь умножьте вектор вероятности на вектор данных, чтобы вычислить среднее значение.

Использование Нампи

Использование панд

Среднее геометрическое

Среднее геометрическое определяется как nth корень произведения n чисел, т. е. для набора чисел x1, x2, …, xn среднее геометрическое определяется как

Гармоническое среднее

Среднее гармоническое может быть выражено как величина, обратная среднему арифметическому обратных величин данного набора наблюдений.

медиана

медиана — это среднее значение, которое рассчитывается с помощью шагов, указанных ниже.

  • сортировать вектор данных в порядке возрастания или убывания
  • если элементы данных нечетные, то медиана находится в индексе (n+1)/2
  • в противном случае возьмите среднее из двух средних значений

Режим

Мода является наиболее часто встречающимся значением и рассчитывается путем подсчета встречаемости значений данных.

Заключение

В этой статье мы изучили арифметические и средневзвешенные значения с математическим ожиданием случайной величины. Мы также рассмотрели среднее геометрическое и гармоническое, а также моду и медиану и реализовали их на языке программирования Python.