Методология; до инветигаци; n Параметрични методи за сравнение на две средства

М. изследвания

Индекс на съдържанието

Въведение

Обикновено при този тип анализ можем да установим изходна хипотеза (нулева хипотеза), която обикновено приема, че интересният ефект е нулев, например, че кръвното налягане е еднакво при мъжете и жените или че две лечения за хиперхолестеролемия са еднакво ефективни. По-късно вероятността за получаване на наблюдаваните данни може да бъде оценена, ако тази хипотеза е вярна. Стойността на тази вероятност съвпада с р-стойността, предоставена от всеки статистически тест, така че колкото по-ниска е тя, толкова по-малко вероятно е първоначалната хипотеза да бъде проверена.

методи

В първия раздел ще бъде представен t-тестът на Student за две независими извадки, въвеждайки необходимите модификации в случай, че променливостта на двете групи е различна. След това ще бъде въведен t тест на Student за случая на две зависими проби.

T на Student за две независими проби

Един от най-често срещаните статистически анализи на практика е може би този, използван за сравняване на две независими групи от наблюдения по отношение на числена променлива. Като пример, нека разгледаме данните, показани в таблица 1, съответстващи на 75 индивида с наднормено тегло, подложени на две различни диети, така че да искаме да сравним теглото на индивидите, започнали всяка от диетите.

Както вече беше усъвършенствано, прилагането на параметричен тест изисква нормалността на наблюденията за всяка от групите. Проверката на тази хипотеза може да се извърши както чрез графични методи (посредством хистограми, графики или графики за нормалност), така и чрез статистически тестове (тест на Колмогоров-Смирнов, тест на Шапиро-Уилкс). Достатъчен брой наблюдения (да кажем повече от 30) обаче, както се случва в дадения пример, оправдава използването на същия www. По същия начин този тип методология ще изисква дисперсията в двете групи наблюдения да бъде еднаква. На първо място, ще бъде разработен t тест на Student за случая, в който се проверяват и двете условия, като по-късно се обсъжда как да се разгледа официално случаят, в който отклоненията не са сходни.

При хипотезите за нормалност и еднаква дисперсия сравнението на двете групи може да се извърши по отношение на един параметър, като средната стойност (Фигура 1а), така че в представения пример следователно началната хипотеза ще бъде:

H0: Средното първоначално тегло е еднакво и в двете групи

Той ще бъде означен с < X 1, X 2. X n> и < Y 1, Y 2. Y m> спрямо теглото, наблюдавано при всеки от субектите, подложени на диета А и диета Б съответно. По принцип броят на наблюденията във всяка от групите, които се сравняват, няма да е необходимо да съвпада, така че в примера n = 40 и m = 35.

Тестът t за две независими проби се основава на статистиката:

(1)

където e означава средното тегло във всяка от групите:

и съответните примерни квазивариани:

С което в този конкретен случай стойността, използвана за контраста, ще бъде:

Ако изходната хипотеза е вярна, статистиката (1) ще следва разпределението на Student на t с n + m-2 степени на свобода. Ако е така, получената стойност трябва да бъде в диапазона на най-голяма вероятност според това разпределение (Фигура 2). Обикновено обхватът на данните, в който е съсредоточена 95% от вероятността, се приема за референция. Стойността p, която повечето статистически пакети обикновено отчитат, не е нищо повече от вероятността да се получат, според това разпределение, по-екстремни данни от предоставените от www. Както вече споменахме, той също отразява вероятността за получаване на наблюдаваните данни, ако първоначалната хипотеза беше вярна. Ако р-стойността е много малка (обикновено се разглежда р 0,05. В представения пример, съответната р-стойност е 0,425, така че няма статистически доказателства, че средното тегло и в двете групи е различно. В таблица 2, градусите свобода (в първата колона) и стойността на α (в първия ред). Числото, което определя тяхното пресичане, е съответната критична стойност. По този начин, ако получената статистика вземе стойност, толкова по-голяма ще се каже, че разликата е значителна.