Размер на извадката и статистическа мощност Максимално обучение

Когато резултатите ми не са значими, наистина ли няма ефект или изследването не е успяло да го открие?

Или, напротив, когато имам значителни резултати, те наистина ли са толкова положителни или експериментът надценява ефектите от лечението?

И накрая, как трябва да планираме нашето проучване, за да получим по-голям шанс за откриване на значителни ефекти?.

Със сигурност по някое време сте попаднали на тези въпроси. Който не! Всички те са свързани със статистическата мощ, която днес ще се опитам да ви обясня в този пост.

Описва вероятността тестът правилно да идентифицира истински, реален ефект. Казано по-просто, това е способността да се различава сигналът от шума. Сигналът, който търсим, е въздействието на лечението върху някакъв резултат, който ни интересува.
Представете си, че искате да проучите ефективността на ново лекарство за грип. Ние се стремим да тестваме неговата ефективност (сигнал). Шумът, който ни засяга, идва от сложността на данните (колко променливи са те). Например ще има шум в резултатите, ако ефикасността на лекарството зависи силно от възрастта на индивида или неговия пол.

Наистина ли няма ефект или проучването не е могло да го открие? Резултатите наистина ли са толкова положителни или експериментът надценява ефектите от лечението? ако вашият анализ има ниска статистическа мощност, резултатите често са трудни за интерпретация.

Трябва да планираме експериментите си по такъв начин, че да постигнем голяма сила на контраста и по този начин да сме сигурни, че ще можем да демонстрираме изследвания ефект.

Обикновено стойност на 0,80 мощност е приемлива и може да се използва като еталон. Обикновено изследователите проектирайте експериментите си по такъв начин, че вашите резултати да са значими 80% от времето.

Лечението (експериментални или инструментални проблеми) и фоновите (силно променливи реакции) шумове не могат да бъдат контролирани, но ние можем правилно проектирайте нашия експеримент по такъв начин, че да получим висока мощност.

Силата на статистическия тест е свързана със:

Размер на извадката «n»: броят на случаите или субектите, участващи в проучването.
Нивото на значимост „алфа“: вероятността за отхвърляне на нулевата хипотеза, когато тя е вярна (грешка от тип I или фалшиво положителна). Обикновено се приема 5% или, което е същото, ниво на доверие от 95% (1-алфа).
Размерът на ефекта "d" или "r": е мярка за промяната в отговора. Опростявайки малко, можем да изчислим мерки, които отразяват разликите в средните стойности между групите (разликата в средните стойности, разделена на стандартното отклонение) или мерки, които показват връзката между променливите (коефициент на корелация), в съответствие с нашата цел.

Ниската мощност може да означава малък размер на извадката, по-малък алфа или малък размер на ефекта и обратното за висока мощност.

Можем да подходим към проблема със статистическата мощ по два алтернативни начина:

Априорен подход. Приемаме ниво на значимост (напр. 5%), стойност за желаната мощност (напр. 80%) и знаем оценки на размера на ефекта, който трябва да бъде открит от предишни проучвания. Следователно, целта е да се определи колко теми трябва да разгледаме в изследването, за да отговорим на тези критерии.
Последващ подход. Приемаме ниво на значимост (напр. 5%), имаме извадка с определен размер (това, което сме успели да направим) и изчисляваме размера на ефекта, наблюдаван в нашето проучване. Искаме да знаем колко мощен е бил нашият анализ за откриване на този размер на ефекта в изследването, което сме провели.