Что лучше: среднее арифметическое или медиана?

В научных исследованиях для описания данных или сравнения показателей в выборках нужно привести средний уровень количественных показателей: каков средний рост, возраст, уровень гемоглобина в крови и т.д. в той или иной когорте исследования. Как же это правильно посчитать?


По школьной привычке (или по пожеланию научного руководителя) первое что приходит на ум – сложить показатели по всем объектам наблюдения и разделить на их число — посчитать среднее арифметическое. В этом посте, мы попытаемся убедить вас не то, чтобы не считать среднее арифметическое, но задуматься перед его использованием, и, может, заставить задуматься вашего научрука 😉


Пример 1. Дано: список зарплат рядовых медицинских сотрудников больницы (в тыс. руб.): 25, 17, 23, 18, 24, 23, 16, а также зарплата главврача – 85 и его заместителя – 50. Каков средний уровень зарплаты в больнице? Согласно среднему арифметическому, средняя зарплата по больнице – 31,2 тыс. рублей. Если же мы посчитаем вместо среднего арифметического медиану, то получим 23 тыс. рублей. Что, по-вашему, ближе к правде?

Пример 2. Имеются данные о погрешности в измерении АД в мм.рт.ст. двумя приборами: А и Б.
Снимок экрана 2016-06-14 в 20.42.49

Сравнение погрешностей приборов критерием Манна-Уитни на сервисе  Статзиллы показало, что средний уровень погрешностей двух приборов статистически значимо различается (уровень статистической значимости р=0,02). При этом, среднее арифметическое ошибки прибора А равно 14,6 мм.рт.ст., но и у прибора Б оно также составило 14,6 мм.рт.ст…Какой из приборов статистически лучше?

Ниже приведены  результаты расчета значимости различий по Манну-Уитни:

а) с использованием среднего арифметического (полная версия по ссылке)

Снимок экрана 2016-06-14 в 20.58.03б) с использованием медианы (полная версия по ссылке)

Снимок экрана 2016-06-14 в 20.55.17

Как видно, средняя погрешность приборов, оцененная с помощью медианы, отличается не только статистически, но и «на глаз»: 14,5 мм.рт.ст у прибора А и 3,5 мм.рт.ст у прибора Б.


Неужели среднее арифметическое настолько плохо и его никогда нельзя использовать? — Конечно, все не так категорично.

Во-первых, если вы знаете, что ваши данные имеют распределение, близкое к нормальному (вы проверили это с помощью теста Колмогорова-Смирнова, Шапиро-Уилка ну или хотя бы просто посмотрели на гистограмму) – то среднее арифметическое является вполне адекватной оценкой и примерно совпадет с медианой.

Во-вторых, медиана оценивает среднее, нивелировав влияние выбросов. Но именно эта «сдержанность» медианы может скрыть из виду важные моменты, тогда как среднее арифметическое, завысив или занизив среднее, поможет обратить на них внимание. Так, в нашем примере 2 с погрешностью прибора, медиана говорит, что прибор Б измеряет давление в среднем точнее. Но высокое среднее арифметическое и сами данные указывают на внушительные выбросы – 30 и 90 мм.рт.ст. Очень важно разобраться с ними и понять, чем вызваны такие аномально высокие ошибки измерений.

В-третьих, что бы вы ни решили использовать, обязательно укажите, насколько эта оценка среднего уровня устойчива. Для этого можно использовать различные показатели: корень из дисперсии, ошибку среднего, квартили, минимум и максимум, доверительный интервал. Только совокупность описательных статистик даст полную картину о рассматриваемом показателе и позволит избежать нелепых ошибок, неверных выводов, страшных вопросов на защите и насмешек коллег 🙂

Ну и, наконец, принимая решение, что же лучше использовать, среднее арифметическое или медиану, вспомните эту таблицу:

Слайд1

Удачи в ваших исследованиях и будьте здоровы!

Статзиллу поздравил губернатор Ростовской области

26 мая Статзилла встретилась с губернатором Ростовской области В.Ю. Голубевым и получила поздравления с Днем предпринимателя!

А вечером в Ростовском государственном музыкальном театре состоялась церемония награждения победителей конкурса Бизнес Дона 2016, где предприниматели и власти города смогли пообщаться уже в неформальной обстановке.

epkcC5GVhXI

Ссылка Василий Голубев: «Диалог власти и бизнеса – залог экономического благополучия Дона» — Правительство Ростовской области

 

Теперь сравнить группы можно онлайн за 1 минуту!

После 6 месяцев упорной разработки наша команда рада представить вам онлайн-сервис по сравнению групп. Statzilla планирует автоматизировать самые типовые статистические задачи, которые возникают в научном процессе в области биомедицины. Начать мы решили именно со сравнений, потому что без них сегодня не обходится ни одно клиническое исследование.

Чем сервис Статзилла лучше программ статистической обработки данных Statistica, SPSS и прочих?

Все очень просто. Нет, в прямом смысле, осуществить статистический анализ в сервисе Статзиллы гораздо проще, чем в специализированных программах, с этим справится любой человек, даже очень далекий от статистики. Чтобы использовать Statistica или SPSS, пользователь должен хорошо разбираться в анализе данных, понимать какой метод ему необходимо выбрать, соблюдаются ли математические предпосылки этого метода.

В нашей команде, мы понимаем, что быть высококвалифицированным врачом и при этом экспертом статистики невозможно требует титанических усилий и множество времени. Однако, качественный статистический анализ является необходимым условием любого биомедицинского исследования. Поэтому мы попытались перевести сложный язык математики в термины, понятные неспециалисту: мы спрашиваем не “какой метод выбрать?” а “какую задачу решить?”

Сервис, благодаря встроенному интеллектуальному алгоритму, сам подбирает необходимые методы на основе загруженных данных.

Главным отличием сервиса является то, что результат прогона — это связанный текст со статистическими выводами, необходимыми таблицами и графиками. Этот аналитический отчет готов для вставки в статью или диссертацию.

Разумеется, исследователю необходимо проинтерпретировать полученные результаты с клинической точки зрения. Не устаем повторять, что статистическая значимость еще не обеспечивает клиническую значимость результата. Но только так, в сотрудничестве специалистов медицины и экспертов статистики рождается новое знание и происходят открытия!

Предпринимательство в Ростове, быть или не быть?

Statzilla появилась на свет в эпоху политики развития среднего и малого бизнеса. Льготное налогообложение, множество программ поддержки. Работает ли это в действительности или это просто красивые слова? Statzilla приняла участие в ток шоу с участием главы Ростовской администрации Сергеем Горбанем. В видео рассказывается о тех видах поддержки, которые сейчас реализуются у нас в городе.

Решать, эффективны эти меры или нет – Вам. Из нашего опыта скажем, что нам вот городские власти помогли с бесплатным офисом и консультациями по юридическим и финансовым вопросам (что в стране, где каждый месяц придумывают новый вид отчетности, немаловажно). А Вы бы начали свое дело в Ростове? Чему оно было бы посвящено?

Смотрите сюжет про нас (с 28 минуты)!