sobota, 20 października 2012

Nazwa rozkładu Studenta


Wiele osób które analizowały swoje ankiety, zastanawiało się nad pochodzeniem nazwy tego rozkładu. Rozkład ten ma zastosowanie min. w estymacji przedziałowej, w testowaniu parametrycznym (test Studenta)  Wielu myśli zapewne, że nazwa pochodzi od popularności tego testu wśród studentów. Prawda jest jednak zgoła inna.  
Rozkład opisał po raz pierwszy William Sealy Gosset, co ciekawe Gosset nie miał gruntownego wykształcenia matematycznego. Natomiast jak podaję Wikipedia był obdarzony wielką intuicją matematyczną, przyjaźnił się również z Karlem Pearsonem, który służył mu pomocną ręką przy obliczeniach matematycznych. Na co dzień pracował w browarach Guinnessa, gdzie był kontrolerem jakości piwa. Swoje wyniki badań nie mógł opublikować pod własnym nazwiskiem gdyż inny badacz w browarze opublikował dokumenty zawierające tajemnice handlowe browaru. Aby zapobiec dalszemu ujawnieniu poufnych informacji, Guinness zakazał swoim pracowników publikowania jakichkolwiek publikacji bez względu na zawartą w nich informację. To oznaczyło, że Gosset nie mógł opublikować swojej pracy pod własnym nazwiskiem. Dlatego użył pseudonimu Student dla swoich publikacji, by uniknąć wykrycia przez jego pracodawcę. Dlatego jego najsławniejsze osiągnięcie w dziedzinie analiz statystycznych, jest teraz nazywane test t Studenta. Gdyby nie to pewnie obliczalibyśmy dzisiaj test t - Gosseta.

Analiza ankiet – test t – Studenta dla prób zależnych

Jest to jeden z częściej stosowanych testów podczas analizy ankiety. W przeciwieństwie do testu t – Studenta dla prób niezależnych, gdzie poddajemy porównaniu dwie grupy, ten rodzaj testu stosowany jest podczas analizy tej samej pojedynczej grupy ale dwukrotnie badamy ją w czasie. Przez zadziałaniem pewnego czynnika oraz po jego działaniu. Aby lepiej przedstawić omawiane zagadnienie zaprezentujemy przykłady. Tematem naszej ankiety jest porównanie średniego poziomu glukozy we krwi u pacjentów z oddziału A i u pacjentów na oddziale B, odpowiednim testem który musimy zastosować jest test t Studenta dla prób niezależnych. Natomiast gdy badamy średni poziom glukozy u pacjentów przed i po posiłku, to właściwym testem do tego typu badań jest test t Studenta dla prób zależnych.
Hipoteza zerowa ma postać: średnie stężenie poziomu glukozy we krwi przed i po posiłku jest identyczne.
Hipoteza alternatywna ma postać: średnie stężenia poziomu glukozy we krwi przed i po posiłku są różne.
 Test ten obłożony jest pewnymi warunkami, jednym z nich jest założenie o zbliżonych rozkładach w grupach do rozkładu normalnego. Do sprawdzenia tego założenia możemy się posłużyć odpowiednimi testami np. test Shapiro Wilka. Stosowany jest dla zmiennych ilościowych oraz mierzalnych.
W odróżnieniu od testu dla prób niepowiązanych, nie musi być spełniony warunek o homogeniczności wariancji.
W przypadku niespełnienia warunków testu stosujemy test Wilcoxona dla danych ilościowych lub porządkowych, lub w przypadku danych o charakterze jakościowym należy zastosować test McNemary.
Właściwą decyzję podejmujemy poprzez porównanie tzw. prawdopodobieństwa testowego p z poziomem istotności α.
W przypadku gdy p jest równe lub mniejsze od poziomu alfa, odrzucamy hipotezę zerową i przyjmujemy hipotezę alternatywną. Wyniki średnich pomiarów stężeń glukozy we krwi u pacjentów przed i po posiłku, są statystycznie różne.
W przypadku gdy  poziom istotności p jest większy od zakładanego poziomu alfa, nie mamy podstaw do odrzucenia hipotezy zerowej. Średnie uzyskanych pomiarów są zbliżone do siebie.