Интуитивные микро- и макроварианты показателей машинного обучения

Введение

Демонстрация четкого понимания микро- и макроэкономических показателей выделит вас как человека, который может извлекать надежные и действенные уроки из данных. Освоение интуиции, лежащей в основе микро- и макростатистических измерений, необходимо для получения более точной информации из ваших экспериментов и их воздействия.

Среднее значение

Почему необходимо различать микро- и макроварианты метрик?

Все сводится к тонкому различию в том, как вы вычисляете среднее значение из ваших данных. Одна точка зрения (микро) заключается в том, что вы не признаете какие-либо подгруппы, присутствующие в ваших данных, и что все отдельные выборки рассматриваются одинаково, независимо от того, одинаково ли представлены подгруппы или нет. Альтернативная точка зрения (макрос) заключается в том, что вы хотите признать, что подгруппы в ваших данных могут отличаться друг от друга, и вы хотите, чтобы метрика учитывала эти различия.

Ниже рассмотрим пример:

Учтите, что вам дали задание вычислить среднюю высоту деревьев в поле. Вы покорно исследуете поле, тщательно измеряя каждое дерево и отмечая его виды.

После этого упражнения у вас останется следующее:

Затем вы просто суммируете значения и умножаете на количество, чтобы получить среднюю высоту дерева.

Вы подсчитали, что средняя высота дерева составляет 25,875 метра. Вы осматриваете поле и думаете про себя, что, хотя это число является истинным средним значением всех отдельных деревьев в этом поле, оно не очень репрезентативно для всех типов деревьев в поле. Это гораздо ближе к высоте дубов, чем елей. Вы начинаете беспокоиться о том, что люди ошибочно сочтут ели за крайние отклонения или примут их за что-то совершенно другое.

Чтобы решить ваши проблемы, вы используете альтернативный подход к своим вычислениям. Сначала вы разделяете свои образцы на подгруппы, пихты и дубы.

Затем вы вычисляете средние значения подгрупп по отдельности следующим образом:

Найдя средние значения для подгрупп, вы затем вычисляете среднее значение:

Вы смотрите на это число и радуетесь, что ни одно из деревьев в поле не может быть оценено как особенно экстремальное, учитывая это среднее значение. Число более репрезентативно для подгрупп деревьев, присутствующих в поле.