Има таен свят, за който вероятно никога не сте чували. То се крие под всяко твърдение, което някога сте чели, всяко заглавие, в което е изписано „наука!“ при вас, докато минавахте покрай вас. Този свят е причината да сте ваксинирани, защо приемате ибупрофен за болка и възпаление и дори защо не можете да получите противозачатъчни хапчета в рецепцията в повечето страни.

Говоря, разбира се, за света на статистиката.

Google статистика за статистиката: най-добрият nerdfest.

Учебна статистика

Представете си, че правите проучване за отслабване. Имате, да речем, три групи хора: 1, 2 и 3. Група 1 приема наркотици. Група 2 провежда лайфстайл интервенция. Група 3 е плацебо контрол - не правят нищо. В края на изследването имате стотици, дори хиляди числа. Можете да ги сравните доста лесно - погледнете средствата и медианите - но всичко това наистина ви подсказва е, че има някои разлики. Те може да са маловажни; може да са просто до случайност. Ами ако имаш един човек от група 2, който започна от 400 килограма и загуби 300, но останалите хора всъщност натрупаха няколко килограма? Вероятно ще имате цялостна загуба на тегло, но наистина вашата житейска намеса работи само за един човек.

Въведете статистика.

Това, което статистически по принцип ви позволява да правите в медицината, е да сравните резултатите от различни групи и да кажете дали вариацията вероятно се дължи на вашия експеримент или просто случайност. Така че сравнявате отново трите си групи хора и установявате, че докато група 2, средно отслабна, тя не е статистически значима, защото всичко се дължи на този човек и неговите мамут усилия.

Оказва се, че новата „шоколадова диета“ не е толкова ефективна, колкото първоначално смятахме.

Сега току-що използвах много важна фраза: статистически значима. Това е основно лентата, която сме поставили за резултатите от изследванията. Ако се качат над летвата, те се считат за най-вероятно поради нещото, което изследвате - в случая наркотиците или интервенцията на начина на живот. По принцип, че лечението работи.

Ако не стигнат до лентата, казваме, че резултатите, които видяхме, вероятно се дължат на шанс и лечението не даде резултат.

Това е доста важна лента.

И, ще се изненадате да чуете, това е напълно произволно.

Какво е значимо?

Когато провеждаме статистически тест, обикновено излизаме с това, което е известно като стойност на вероятността или p-стойност. Това е число между нула и едно, което ни дава индикация колко е вероятно, че резултатът, който наблюдаваме в нашия експеримент, се дължи на случайността. Висока p-стойност означава, че всяка разлика между групите вероятно е била вълна; ниска p-стойност означава, че може да сме на нещо тук. Обикновено p-стойност под 0,05 означава, че вашите резултати са статистически значими.

С други думи, 0,05 е лентата, за която говорих по-рано.

В този бар няма напитки, само смесени метафори и тъга.

Но проблемът е, че 0,05 е напълно произволно число. Можем да кажем 0,04, или 0,06 - това наистина няма да има значение. Запомнете: Това е просто мярка за вероятността резултатите да са били до случайност.

Ако кажа, че нещо е статистически значимо, казвам, че всякакви различия между групите в изследването ми вероятно не се дължат на случайност. Има ефект там.

Да речем, че правя експеримента си и откривам статистически значима разлика между група 1 и група 3, като група 1 губи 100 грама повече тегло за шестте месеца на експеримента. Нашата p-стойност е невероятно ниска, 0,000001.

Звучи като добри новини, нали?

Клинична значимост

Така че преминахме първия тест: Знаем, че разликата, която виждаме, вероятно се дължи на лекарството, което даваме група 1. Статистическият тест казва така!

Но това не е единственият вид значимост.

Статистическата значимост е за това дали едно нещо е причинило друго. Клиничното значение е за това дали ни интересува. Има ли значение дали можем да накараме някои хора да отслабнат 100 грама тегло? Заслужава ли си да вземеш наркотик през следващите няколко месеца, години или дори до края на живота си?

Ами ако ви кажа, че тя също причинява мигрена, гадене и екзистенциален гняв?

Така че, ако кажа, че новото ми лекарство е клинично значимо, това, което всъщност казвам, е, че мисля, че ползите, които носи, превишават страничните ефекти. Казвам, че променя здравето ви достатъчно, за да може лекар да се заинтересува да го предпише и всъщност може да искате да го използвате за лечение.

Всъщност клиничното значение е единственото, което ни интересува.

Един чудесен пример е разликата между мъжкия и женския мозък. Огромно проучване наскоро установи статистическа разлика между действието на мозъка на мъжете в сравнение с жените в няколко ключови региона. Те обаче откриха също, че приликите надвишават разликите и в крайна сметка няма клинична разлика между мъжете и жените.

Незначително значение.

Въпросът е, че можете да направите проучване и да намерите статистически разлики, но освен ако не знаете дали тези различия са клинично значими, всичко, което правите, е да играете с числа. Изследователите в това проучване не можаха да разберат мозъка на мъжа от жената, освен ако предварително не знаеха кой е кой, тъй като статистически значимите различия в активността не се превръщат в нещо, което реално биха могли да използват в работата си.

Но когато прочетете новина за научен материал, никога няма да чуете за нюанса на клиничното значение. Спомняте ли си всички онези страшни истории за ибупрофен и инфаркти? Всъщност има добре известна статистически значима връзка между приема на ибупрофен и сърдечен удар. Единственият проблем е, че за повечето от нас увеличението на риска е много малко - то е статистически значимо, но не и клинично значимо.

Тръгва и по другия път: Има статистически значима връзка между умереното пиене и не умирането. Единственият проблем е, че разликата е малка и вероятно се обяснява с други фактори, така че няма причина да започвате да пиете чаша вино всеки ден.

Почти всяка статия, която някога ще прочетете в науката, цитира статистически данни, като те означават нещо.

Твърде често те не го правят.

Забележимо значение

Трудно е да се знае какво има значение, когато става дума за изследвания. Клиничното значение е нещо, което често изисква медицинска степен и години на обучение, за да се разбере правилно.

Но има няколко неща, на които можете да внимавате.

Ако размерът на абсолютния ефект е малък, освен ако не е наистина сериозно събитие (като смърт), вероятността клиничната значимост е ограничена. Ако резултатът, за който хората говорят, е само тангенциално свързан с действителното здраве - например с количеството изяден сладолед - има голям шанс резултатите всъщност да не ви кажат много за живота ви.

Ако някога наистина сте притеснени, отидете на лекар. Има причина, която отнема почти десетилетие, за да бъдете напълно квалифицирани.

Понякога тези неща не са толкова лесни.