Ура, опубликован прекрасный рейтинг и прекрасная новость.
"За последние два года объем банковских вкладов физических лиц вырос в России на 19,6%, или пять триллионов рублей. В настоящее время в среднем на одного человека приходится 210 тысяч рублей депозитов." (с) РИА Новости.
Вот счастье то, подумал я, и полез на свой депозит. Странно, но там не оказалось подобной суммы :)
Почему?
Ну да, все та же "средняя температура по больнице". Тут все как обычно.
А если копнуть чуть глубже, то вообще все интереснее. Следите за руками.
1. Нет такого универсального среднего числа. То, что используется в СМИ - это среднее арифметическое. Самое простое, что в школе проходят. У Маши 1 яблоко, у Васи 9. В среднем у них по 5 яблок, но Маша съест одно и будет смотреть на Васю, который сожрет 6 и не подавится. И у него еще останется больше яблок, чем у Маши. В три раза! Но да, в среднем они могут съесть по 5 яблок.
2. Средних значение достаточно много. И среднее арифметическое - лишь одно из множеств числовых характеристик множества чисел.
3. Самое забавное. Немного умных слов. У среднего арифметического отсутствует робастность. То есть - отсутствует устойчивость к влиянию различных "выбросов". Если совсем просто - среднее арифметическое НЕ используется в робастной (устойчивой) статистике, потому что подвержено сильному влиянию "больших отклонений".
Да-да, это именно тот случай, когда у 9 человек по 1 рублю, а у одного - 91 рубль. В среднем у них по 10 рублей. При этом у этих 9 человек даже в складчину не будет 10 рублей, а для того жирдяя с 91 рублями эти 10 рублей не так и важны.
Для таких случаев (когда есть "большие выбросы") используется медиана. И вот при расчете медианы для выше приведенного примера она будет равна 1. Это и есть число характеризующее выборку и именно оно наиболее точно отражает подобные числовые распределения.
Даже в примерах и описаниях для среднего арифметического и медианы используется как показатель пример 10 бедняков и одного жирдяя.
Проблемы среднего арифметического - "Отсутствие робастности. Примечательно, что для распределений с большим коэффициентом асимметрии среднее арифметическое может не соответствовать понятию «среднего», а значения среднего из робастной статистики (например, медиана) может лучше описывать центральную тенденцию. Классическим примером является подсчёт среднего дохода. Например, отчёт о «среднем» чистом доходе в Медине, штат Вашингтон, подсчитанный как среднее арифметическое всех ежегодных чистых доходов жителей, даст на удивление большое число из-за Билла Гейтса." :)
Для медианы (в статистике) - " Поскольку оценки медианы более робастны, её оценивание может быть более предпочтительным для распределений с т. н. тяжёлыми хвостами." ну и далее идет классический пример с 10 бедняками и одним жирдяем.
То есть, среднее арифметическое не используется для распределений с большим коэффициентом асимметричности. Когда в выборке 10 нищих и 1 жирдяй. Применение среднего арифметического в этом случае приводит к ошибочному результату. Но признать этот факт - значит признать огромное неравенство в доходах в нашей стране. Что как ножом по яйцам нашему руководству. Правильнее применять вычисление медианы, но тогда все эти красивые картинки сразу исчезнут, сразу станет виден реальный доход населения и это по сути будет признанием факта огромного неравенства в доходах населения.
Вот и пичкают СМИ народ красивыми картинками про среднюю зарплату и средние вклады. Смысла нуль, но красиво.