Wariancja

Z Wikipedii, wolnej encyklopedii
Przejdź do nawigacji Przejdź do wyszukiwania

Wariancja – klasyczna miara zmienności. Intuicyjnie utożsamiana ze zróżnicowaniem zbiorowości; jest średnią arytmetyczną kwadratów odchyleń (różnic) poszczególnych wartości cechy od wartości oczekiwanej.

Odchylenie standardowe – klasyczna miara zmienności, obok średniej arytmetycznej najczęściej stosowane pojęcie statystyczne.Odchylenie wyniku – różnica pomiędzy określonym wynikiem w pewnym rozkładzie a średnią arytmetyczną z tego rozkładu. Odchylenia wyników wykorzystywane są do obliczania wariancji.

Wariancja zmiennej losowej oznaczana jako lub zdefiniowana jest wzorem:

Szereg rozdzielczy (ang. stem-and-leaf lub stemplot) jest statystycznym sposobem prezentacji rozkładu empirycznego. Uzyskuje się go dzieląc dane statystyczne na pewne kategorie i podając liczebność lub częstość zbiorów danych przypadających na każdą z tych kategorii.Populacja statystyczna (inaczej populacja generalna, zbiorowość generalna) – zbiór elementów, podlegających badaniu statystycznemu.

gdzie: jest wartością oczekiwaną zmiennej losowej podanej w nawiasach kwadratowych, jest wartością oczekiwaną zmiennej

Innym, często prostszym, sposobem wyznaczania wariancji jest wzór:

Analiza wariancji (ANOVA - od ang. analysis of variance) to metoda statystyczna, służąca do badania obserwacji, które zależą od jednego lub wielu działających równocześnie czynników. Metoda ta wyjaśnia, z jakim prawdopodobieństwem wyodrębnione czynniki mogą być powodem różnic między obserwowanymi średnimi grupowymi. Analiza wariancji została stworzona w latach dwudziestych przez Ronalda Fishera.Testy dla wariancji – są to testy parametryczne służące do weryfikacji hipotez statystycznych dotyczących wartości wariancji w populacji generalnej lub też do porównania wartości wariancji w dwóch lub kilku populacjach – na podstawie znajomości wartości badanej cechy w losowej próbie (lub w kilku próbach). Rozstrzygnięcie pytań dotyczących wariancji jest ważne m.in. dlatego, że wiele testów służących do porównania wartości średnich w dwóch lub kilku populacjach wymaga przyjęcia założenia o równości wariancji w tych populacjach (tak zwane założenie o jednorodności wariancji). Ponadto wariancja może być miernikiem dokładności w procesie pomiarowym lub produkcyjnym (zbyt duża wariancja wyników pomiaru może na przykład świadczyć o uszkodzeniu lub rozregulowaniu aparatury lub urządzeń).

Wariancja jest momentem centralnym drugiego rzędu zmiennej losowej.

Cecha statystyczna – właściwość populacji, która jest przedmiotem badania statystycznego. Zgodnie z definicją cecha statystyczna jest to funkcja przypisująca elementom populacji elementy zbioru wartości cechy statystycznej.Miara zróżnicowania rozkładu to taka miara rozkładu, która opisuje relację pomiędzy rozkładami różniącymi się zróżnicowaniem (rozproszeniem) wartości cechy wokół wartości centralnych.

Jeżeli ponadto oraz jest σ-ciałem zdarzeń, to wariancją warunkową nazywamy:

Zmienna losowa – funkcja przypisująca zdarzeniom elementarnym liczby. Intuicyjnie: odwzorowanie przenoszące badania prawdopodobieństwa z niewygodnej przestrzeni probabilistycznej do dobrze znanej przestrzeni euklidesowej. Zmienne losowe to funkcje mierzalne względem przestrzeni probabilistycznych.Wartość oczekiwana (wartość średnia, przeciętna, dawniej nadzieja matematyczna) – w rachunku prawdopodobieństwa wartość określająca spodziewany wynik doświadczenia losowego. Wartość oczekiwana to inaczej pierwszy moment zwykły. Estymatorem wartości oczekiwanej rozkładu cechy w populacji jest średnia arytmetyczna.

Estymatory[ | edytuj kod]

Wariancję dla szeregu szczegółowego wyznacza się ze wzoru:

Zbiór miary zero – zbiór mierzalny rozważanej przestrzeni mierzalnej ( X , M ) {displaystyle scriptstyle (X,{mathfrak {M}})} „nieistotny” z punktu widzenia zadanej na niej miary μ , {displaystyle scriptstyle mu ,} tzn. dowolny zbiór A ∈ M {displaystyle scriptstyle Ain {mathfrak {M}}} spełniający μ ( A ) = 0. {displaystyle scriptstyle mu (A)=0.} Podzbiory zbiorów miary zero nazywa się zaniedbywalnymi (w szczególności każdy zbiór miary zero jest zaniedbywalny); jeśli miara jest zupełna (tj. zbiory zaniedbywalne są mierzalne), to z jej monotoniczności wynika też, że każdy zbiór zaniedbywalny jest miary zero, co oznacza, że wtedy pojęcia te są równoważne.Potęgowanie – działanie dwuargumentowe będące uogólnieniem wielokrotnego mnożenia elementu przez siebie. Potęgowany element nazywa się podstawą, zaś liczba mnożeń, zapisywana zwykle w indeksie górnym po prawej stronie podstawy, nosi nazwę wykładnika. Wynik potęgowania to potęga elementu.

a dla szeregu rozdzielczego:

Kontrola autorytatywna – w terminologii bibliotekoznawczej określenie procedur zapewniających utrzymanie w sposób konsekwentny haseł (nazw, ujednoliconych tytułów, tytułów serii i haseł przedmiotowych) w katalogach bibliotecznych przez zastosowanie wykazu autorytatywnego zwanego kartoteką wzorcową.Pierwiastkowanie – w matematyce operacja odwrotna względem potęgowania. Ponieważ często istnieje wiele liczb (tzw. pierwiastki algebraiczne), które podniesione do pewnej potęgi dają daną liczbę, to pierwiastkowanie nie może być w ogólności nazwane działaniem; często można jednak ograniczyć dziedzinę działania potęgowania tak, by możliwe było jego odwrócenie (dając tzw. pierwiastki arytmetyczne).

Wariancja próby losowej o wartościach gdzie jest następująca:

Gemeinsame Normdatei (GND) – kartoteka wzorcowa, stanowiąca element centralnego katalogu Niemieckiej Biblioteki Narodowej (DNB), utrzymywanego wspólnie przez niemieckie i austriackie sieci biblioteczne.Błąd średniokwadratowy, średni błąd kwadratowy (MSE, ang. Mean Squared Error) estymatora θ ^ {displaystyle {hat { heta }}} nieobserwowanego parametru θ {displaystyle heta } definiowany jest jako:

Wariancję dla populacji można estymować za pomocą n-elementowej próby losowej. Estymator największej wiarygodności:

jest zgodnym, lecz obciążonym estymatorem wariancji (jest nieobciążony asymptotycznie). Innymi słowy, gdybyśmy z populacji losowali próbkę wielokrotnie i obliczali jego wyniki, to ich średnia nie byłaby równa wariancji w całej populacji. Dlatego też częściej używa się również zgodnego, lecz nieobciążonego estymatora:

W przypadku, gdy znamy dokładną wartość oczekiwaną w populacji, wówczas estymator

jest już nieobciążony i zgodny.

Podstrony: 1 [2] [3]




Reklama