Среднее арифметическое, гармоническое и геометрическое, медиана, мода и ожидаемое значение случайной величины
Центральная тенденция - это отдельное значение, которое представляет собой центр распределения данных. Это очень важно и является краеугольным камнем многих статистических моделей и теорий, таких как проверка гипотез, доверительные интервалы, алгоритм кластеризации k-mean, нормальное и другие распределения данных и т. д. Наиболее распространенными мерами центральной тенденции являются среднее арифметическое, медиана и мода. В этой статье мы изучим и реализуем следующие основные тенденции в языке программирования Python.
- Среднее арифметическое
- Средневзвешенное значение
- Ожидаемое значение случайной величины
- Среднее геометрическое
- Гармоническое среднее
- медиана
- Режим
Среднее арифметическое
Среднее арифметическое также называется средним и рассчитывается путем деления суммы наблюдений на общее количество наблюдений. μ используется для среднего значения совокупности, а x̄ используется для среднего значения выборки.
Средневзвешенное значение
Средневзвешенное значение вычисляется путем деления скалярного произведения вектора данных и вектора весов на сумму вектора весов, формула приведена ниже.
Ожидаемое значение случайной величины
- Создайте векторы значений и частот из вектора данных с помощью
np.unique(data, return_counts = True)
- Вычислите среднее значение путем деления скалярного произведения данных и векторов частоты на вектор частоты
- Мы также можем рассчитать ожидаемое значение, вычислив вектор вероятности из вектора частот
f
какp = f/sum(f)
- Теперь умножьте вектор вероятности на вектор данных, чтобы вычислить среднее значение.
Использование Нампи
Использование панд
Среднее геометрическое
Среднее геометрическое определяется как nth
корень произведения n
чисел, т. е. для набора чисел x1, x2, …, xn
среднее геометрическое определяется как
Гармоническое среднее
Среднее гармоническое может быть выражено как величина, обратная среднему арифметическому обратных величин данного набора наблюдений.
медиана
медиана — это среднее значение, которое рассчитывается с помощью шагов, указанных ниже.
- сортировать вектор данных в порядке возрастания или убывания
- если элементы данных нечетные, то медиана находится в индексе
(n+1)/2
- в противном случае возьмите среднее из двух средних значений
Режим
Мода является наиболее часто встречающимся значением и рассчитывается путем подсчета встречаемости значений данных.
Заключение
В этой статье мы изучили арифметические и средневзвешенные значения с математическим ожиданием случайной величины. Мы также рассмотрели среднее геометрическое и гармоническое, а также моду и медиану и реализовали их на языке программирования Python.