Test zgodności chi-kwadrat

Z Wikipedii, wolnej encyklopedii
(Przekierowano z Test chi-kwadrat)
Przejdź do nawigacji Przejdź do wyszukiwania

Test chi-kwadrat – każdy test statystyczny, w którym statystyka testowa ma rozkład chi kwadrat, jeśli teoretyczna zależność jest prawdziwa. Test chi-kwadrat służy sprawdzaniu hipotez. Innymi słowy wartość testu oceniana jest za pomocą rozkładu chi kwadrat. Test najczęściej wykorzystywany w praktyce. Można go wykorzystywać do badania zgodności zarówno cech mierzalnych, jak i niemierzalnych.

Rozkład prawdopodobieństwa – w najczęstszej interpretacji (rozkład zmiennej losowej) miara probabilistyczna określona na sigma-ciele podzbiorów zbioru wartości zmiennej losowej (wektora losowego), pozwalająca przypisywać prawdopodobieństwa zbiorom wartości tej zmiennej, odpowiadającym zdarzeniom losowym. Formalnie rozkład prawdopodobieństwa może być jednak rozpatrywany także bez stosowania zmiennych losowych.Test statystyczny - formuła matematyczna pozwalająca oszacować prawdopodobieństwo spełnienia pewnej hipotezy statystycznej w populacji na podstawie próby losowej z tej populacji.

Test | edytuj kod]

W ogólności zachodzi:

gdzie:

Odchylenie standardowe – klasyczna miara zmienności, obok średniej arytmetycznej najczęściej stosowane pojęcie statystyczne.Całka – ogólne określenie wielu różnych, choć powiązanych ze sobą pojęć analizy matematycznej. W artykule rachunek różniczkowy i całkowy podana jest historia ewolucji znaczenia samego słowa całka. Najczęściej przez "całkę" rozumie się całkę oznaczoną lub całkę nieoznaczoną (rozróżnia się je zwykle z kontekstu).
– wartość mierzona, – wartość teoretyczna (oczekiwana) wynikająca z hipotezy odpowiadająca wartości mierzonej, odchylenie standardowe, – liczba pomiarów.

Zliczenia[ | edytuj kod]

W szczególności, gdy wartościami są zliczenia, wtedy ich odchylenie standardowe wynosi i równanie przechodzi na:

Prawdopodobieństwo – ogólne określenie jednego z wielu pojęć służących modelowaniu doświadczenia losowego poprzez przypisanie poszczególnym zdarzeniom losowym liczb, zwykle z przedziału jednostkowego (w zastosowaniach często wyrażanych procentowo), wskazujących szanse ich zajścia. W rozumieniu potocznym wyraz „prawdopodobieństwo” odnosi się do oczekiwania względem rezultatu zdarzenia, którego wynik nie jest znany (niezależnie od tego, czy jest ono w jakimś sensie zdeterminowane, miało miejsce w przeszłości, czy dopiero się wydarzy); w ogólności należy je rozumieć jako pewną miarę nieprzewidywalności.Kości do gry – niewielkie wielościany z umieszczonymi na poszczególnych bokach liczbami (oczkami). Wykorzystuje się je w grach planszowych, fabularnych, bitewnych i hazardowych w celu generowania losowych wyników. Najczęściej spotykane są kości sześcienne.

Uwagi:

Poziom istotności – jest to maksymalne dopuszczalne prawdopodobieństwo popełnienia błędu I rodzaju (zazwyczaj oznaczane symbolem α). Określa tym samym maksymalne ryzyko błędu, jakie badacz jest skłonny zaakceptować. Wybór wartości α zależy od badacza, natury problemu i od tego, jak dokładnie chce on weryfikować swoje hipotezy, najczęściej przyjmuje się α = 0,05; rzadziej 0,1, 0,03, 0,01 lub 0,001. Wartość założonego poziomu istotności jest porównywana z wyliczoną z testu statystycznego p-wartością (czasem porównuje się od razu wartości statystyki testowej z wartością odpowiadającą danemu poziomowi istotności). Jeśli p-wartość jest większa, oznacza to, iż nie ma powodu do odrzucenia tzw. hipotezy zerowej H0, która zwykle stwierdza, że obserwowany efekt jest dziełem przypadku.Nauki społeczne - nauki badające strukturę i funkcje dziejów społeczeństwa, jego kulturę, prawa i prawidłowości jego rozwoju. Obok nauk przyrodniczych i nauk humanistycznych zaliczają się do nauk empirycznych. Nauki społeczne odróżniają się od nauk humanistycznych naukowymi metodami poznania oraz tym, że stosują ścisłe kryteria.
  • Przyjmuje się, że wartość powinna być większa lub równa 5 (spotyka się też 10 – nie ma ścisłego wyprowadzenia minimalnej wielkości).
  • Czasem z tego powodu przy pomiarach wartości dyskretnych łączy się te wartości w jeden przedział (patrz przykład).
  • Przy pomiarze wartości ciągłej wartość teoretyczna to całka z rozkładu prawdopodobieństwa po odpowiednim przedziale z którego zliczane były wyniki.
  • Przykład

    Rozpatrzmy rzut pięcioma kośćmi i liczbę wyrzuconych szóstek Może ona przyjmować wartości 0,1,2,3,4,5, nie widać więc potrzeby dzielenia tych wielkości na przedziały. Rzut został powtórzony 200 razy, wartości teoretyczne dla takiej liczby rzutów przedstawione są w tabeli, w kolumnie Widać że dla są to wartości bardzo małe, dlatego też należy stworzyć nowe przedziały, tak aby w każdym wartość teoretyczna była większa od 5. Przedstawione jest to w tabeli, oznaczone są one przez

    Rachunek błędów – zespół zagadnień na pograniczu metrologii, statystyki i matematyki stosowanej, obejmujący zasady opracowywania i prezentacji wyników doświadczalnych. Analiza błędów obejmuje dyskusje zasadności stosowanych metod pomiarowych, dyskusje ich dokładności i powtarzalności oraz właściwą analizę wielkości błędów, czyli właśnie rachunek błędów. Wszelkie wyniki pomiarów pozbawione dyskusji błędów, a zwłaszcza określenia błędu pomiarowego, są w istocie wyłącznie wskazaniami. Jeśli na przykład ktoś stwierdza, że jest wzrostu 4 m, to w zasadzie może być to prawda, bowiem kluczowe jest zagadnienie: w jaki sposób dokonano pomiaru.Rozkład dwumianowy (w Polsce zwany też rozkładem Bernoulliego, choć w krajach anglojęzycznych termin Bernoulli distribution odnosi się do rozkładu zero-jedynkowego) to dyskretny rozkład prawdopodobieństwa opisujący liczbę sukcesów k w ciągu N niezależnych prób, z których każda ma stałe prawdopodobieństwo sukcesu równe p. Pojedynczy eksperyment nosi nazwę próby Bernoulliego.

    Mając dane z rzutów można obliczyć ich zgodność z rozkładem teoretycznym (tutaj jest to rozkład dwumianowy ). W praktyce byłby to test kości na to, jak dobrze jest wyważona.

    Rozrzut (także: rozproszenie, rozsiew, dyspersja) - zróżnicowanie zaobserwowanych wartości zmiennej. Jest tym większy, im bardziej te wartości odchylają się od tendencji centralnej. Obok tendencji centralnej rozrzut jest podstawową charakterystyką próby statystycznej. Najczęściej stosowanymi miarami rozrzutu są wariancja, odchylenie standardowe, rozstęp, odchylenie ćwiartkowe.Średnia - w najogólniejszej wersji dowolna funkcja Parser nie mógł rozpoznać(nieznany błąd): mu (a_{{1}},ldots ,a_{{n}})

    Sprawdzanie zależności dwu mierzonych wartości[ | edytuj kod]

    Mając dwie serie pomiarów i a także teoretyczną zależność można określić dzięki testowi chi-kwadrat na ile ta zależność pasuje do danych doświadczalnych. Przyjmując, że wartość błędu x jest zaniedbywalna i jako błąd wartości

    Rozkład chi kwadrat (zapisywany także jako χ²) to rozkład zmiennej losowej, która jest sumą k kwadratów niezależnych zmiennych losowych o standardowym rozkładzie normalnym. Liczbę naturalną k nazywa się liczbą stopni swobody rozkładu zmiennej losowej.

    Normalizacja[ | edytuj kod]

    Wartość zredukowanego testu chi-kwadrat wynosi   – liczba stopni swobody,

    gdzie to liczba parametrów modelu teoretycznego szacowanych na podstawie danych pomiarowych. Może to być np. średnia, dyspersja, parametr funkcji czy całkowita liczba pomiarów. Można udowodnić, że nieznormalizowany test chi-kwadrat ma oczekiwaną wartość zatem test unormowany powinien wynosić 1. Widać także, że liczba pomiarów powinna być większa od liczby szacowanych parametrów. Okazuje się, że za pomocą testu chi-kwadrat można potwierdzić każdą teorię o dostatecznie dużej liczbie parametrów.

    W poprzednim przykładzie, aby obliczyć wartość oczekiwaną należy pomnożyć rozkład przez liczbę rzutów, przyjąć (nie szacujemy żadnych parametrów modelu); wtedy

    Interpretacja[ | edytuj kod]

    Otrzymaną wartość znormalizowanego testu ocenia się za pomocą rozkładu chi kwadrat. Polega to na obliczeniu prawdopodobieństwa otrzymania wartości testu równej lub większej, niż otrzymanej przez nas. Ponieważ takie obliczenia są dość skomplikowane, najczęściej korzysta się z danych zamieszczonych w odpowiednich tablicach.

    Mając odpowiednie prawdopodobieństwo, należy określić jego najmniejszą wartość, dla której jesteśmy w stanie zaakceptować hipotezę jako prawdę. Przyjmuje się te wartości różnie. Okazuje się, że zbyt duże prawdopodobieństwo także świadczy o złym wyniku (lub o wyniku nieuczciwym). Wynika to z faktu, że dane podlegają pewnemu rozkładowi, więc bardzo mało prawdopodobne jest, aby wszystkie otrzymane wyniki tak dobrze pasowały do modelu teoretycznego.

    Podstrony: 1 [2] [3]




    Reklama