• Artykuły
  • Forum
  • Ciekawostki
  • Encyklopedia
  • Ranga - statystyka



    Podstrony: 1 [2] [3] [4]
    Przeczytaj także...
    Rozkład normalny, zwany też rozkładem Gaussa – jeden z najważniejszych rozkładów prawdopodobieństwa. Odgrywa ważną rolę w statystycznym opisie zagadnień przyrodniczych, przemysłowych, medycznych, społecznych itp. Wykres funkcji prawdopodobieństwa tego rozkładu jest krzywą dzwonową.Skala interwałowa (przedziałowa) – jeden z rodzajów skal pomiarowych. Zmienna jest na skali interwałowej, gdy różnice między dwiema jej wartościami dają się obliczyć i mają interpretację w świecie rzeczywistym, jednak nie ma sensu dzielenie dwóch wartości zmiennej przez siebie. Innymi słowy określona jest jednostka miary, jednak punkt zero jest wybrany umownie.

    Ranga – numer kolejny obserwacji statystycznej w próbie po uporządkowaniu obserwacji według wartości jednej ze zmiennych. Zwykle stosuje się uporządkowanie rosnące i numerowanie od 1.

    Zastąpienie zmiennej przez wyliczone według niej rangi jest operacją zwaną rangowaniem. Rangowanie jest zwykle stosowane w celu uniezależnienia się od rozkładu zmiennej oraz możliwych wystąpień obserwacji odstających. Pozwala ono również na stosowanie metod statystycznych w odniesieniu do zmiennych porządkowych, a nie tylko przedziałowych i ilorazowych. Rangowanie jest też pierwszym krokiem wielu metod statystyki nieparametrycznej, tzw. metod rangowych, takich jak np. korelacja rangowa.

    Rozkład prawdopodobieństwa – w najczęstszej interpretacji (rozkład zmiennej losowej) miara probabilistyczna określona na sigma-ciele podzbiorów zbioru wartości zmiennej losowej (wektora losowego), pozwalająca przypisywać prawdopodobieństwa zbiorom wartości tej zmiennej, odpowiadającym zdarzeniom losowym. Formalnie rozkład prawdopodobieństwa może być jednak rozpatrywany także bez stosowania zmiennych losowych.Tau Kendalla – statystyka będąca jedną z miar monotonicznej zależności dwóch zmiennych losowych. Służy w praktyce do opisu korelacji między zmiennymi porządkowymi.

    Rangowanie można zastosować do wielu zmiennych w próbie, porządkując każdą zmienną z osobna, nadając odpowiednie rangi, a następnie wracając do pierwotnego ustawienia obserwacji.

    Rangi wiązane[ | edytuj kod]

    W przypadku występowania obserwacji o równej wartości rangowanej zmiennej (tzw. rangi wiązane, ang. tied ranks), zwykle wszystkim tym obserwacjom przypisuje się identyczną rangę, równą średniej z ich numerów kolejnych. Stąd rangi mogą mieć wartości niecałkowite.

    Korelacja rangowa – dowolna statystyka pozwalająca na określenie zależności zmiennych losowych w sposób niezmienniczy ze względu na operację rangowania.Statystyka (niem. Statistik, „badanie faktów i osób publicznych”, z łac. [now.] statisticus, „polityczny, dot. polityki”, od status, „państwo, stan”) – nauka, której przedmiotem zainteresowania są metody pozyskiwania i prezentacji, a przede wszystkim analizy danych opisujących zjawiska, w tym masowe.

    Pakiety statystyczne posiadają też możliwość traktowania rang wiązanych w inny sposób, np.

  • przez przypisanie im największego lub najmniejszego numeru kolejnego z danej serii (co jednak zmienia średnią wyniku),
  • przez przypisanie numerów kolejnych bez zważania na rangi wiązane (wówczas wyniki rangowania zależą nie tylko od wartości rangowanej zmiennej, ale i od kolejności obserwacji w tabeli).
  • Przykład[ | edytuj kod]

    W pięcioelementowej próbie znajdują się następujące obserwacje zmiennej

    Sir Maurice George Kendall (ur. 6 września 1907 - zm. 29 marca 1983) – statystyk brytyjski. Jeden z pionierów statystyki nieparametrycznej i metod rangowych. Znany m.in. z prac nad współczynnikami korelacji rangowej (tau Kendalla, W Kendalla).Korelacja rang Spearmana (lub: korelacja rangowa Spearmana, rho Spearmana) – w statystyce jedna z nieparametrycznych miar monotonicznej zależności statystycznej między zmiennymi losowymi.

    Po posortowaniu według wartości x, uzyskujemy kolejność:

    Statystyka nieparametryczna – gałąź statystyki, zajmująca się modelami i metodami, nie wymagającymi założeń odnośnie do rozkładu populacji z której losowana jest próba.Skala porządkowa – jeden z rodzajów skal pomiarowych. Zmienne są na skali porządkowej, gdy przyjmują wartości, dla których dane jest uporządkowanie (kolejność), jednak nie da się w sensowny sposób określić różnicy ani ilorazu między dwiema wartościami.

    Jak widać obserwacje i mają tę samą wartość zmiennej Rangi zmiennej

    Analiza wariancji (ANOVA - od ang. analysis of variance) to metoda statystyczna, służąca do badania obserwacji, które zależą od jednego lub wielu działających równocześnie czynników. Metoda ta wyjaśnia, z jakim prawdopodobieństwem wyodrębnione czynniki mogą być powodem różnic między obserwowanymi średnimi grupowymi. Analiza wariancji została stworzona w latach dwudziestych przez Ronalda Fishera.Wariancja to w statystyce klasyczna miara zmienności. Intuicyjnie utożsamiana ze zróżnicowaniem zbiorowości; jest średnią arytmetyczną kwadratów odchyleń (różnic) poszczególnych wartości cechy od wartości oczekiwanej.

    Po przywróceniu pierwotnej kolejności obserwacji w zbiorze:

    Statystyka odpornościowa lub odporne metody statystyczne (ang. robust statistics) – gałąź statystyki, obejmująca metody projektowane pod kątem odporności na niewielkie odejście od założeń modelu (szczególnie występowanie obserwacji odstających) lub rezygnacji z niektórych założeń.Brakujące dane (braki danych) to w statystyce miejsca w danych, których wartości nie są znane. Mogą powstawać w sposób naturalny (np. w wyborach znane są wstępne wyniki jedynie z części komisji wyborczych), lub sztuczny (np. po usunięciu obserwacji odstających).
    Metody rangowe – zbiór metod statystycznych w których próba jest na wstępie rangowana, tzn. każda wartość każdej cechy jest zastępowana jej pozycją (rangą) na uporządkowanej rosnąco liście wszystkich wartości tej cechy, lub przynajmniej niezmienniczych ze względu na operację rangowania danych wejściowych..Rozkład wykładniczy to rozkład zmiennej losowej opisujący sytuację, w której obiekt może przyjmować stany X i Y, przy czym obiekt w stanie X może ze stałym prawdopodobieństwem przejść w stan Y w jednostce czasu. Prawdopodobieństwo wyznaczane przez ten rozkład to prawdopodobieństwo przejścia ze stanu X w stan Y w czasie δt.


    Podstrony: 1 [2] [3] [4]




    Warto wiedzieć że... beta

    Obserwacja odstająca, element odstający (ang. outlier) – obserwacja posiadająca nietypową wartość zmiennej niezależnej (objaśniającej) lub nietypowe wartości obydwu zmiennych – zależnej (objaśnianej) i objaśniającej (objaśniających w analizie regresji wielokrotnej). Oznacza to, że związek między Xi a Yi dla danej obserwacji jest inny niż dla reszty obserwacji w zbiorze danych.
    Dystrybuanta (fr. distribuer „rozdzielać, rozdawać”) – w rachunku prawdopodobieństwa, statystyce i dziedzinach pokrewnych, funkcja rzeczywista jednoznacznie wyznaczająca rozkład prawdopodobieństwa (tj. miarę probabilistyczną określoną na σ-ciele borelowskich podzbiorów prostej), a więc zawierająca wszystkie informacje o tym rozkładzie. Dystrybuanty są efektywnym narzędziem badania prawdopodobieństwa, ponieważ są obiektami prostszymi niż rozkłady prawdopodobieństwa. W statystyce dystrybuanta rozkładu próby zwana jest dystrybuantą empiryczną i jest blisko związana z pojęciem rangi.
    Obserwacja statystyczna – pojedyncza realizacja zmiennej losowej. W praktyce zwykle jest to wielowymiarowa zmienna losowa, wówczas obserwacją statystyczną jest wektor realizacji składowych zmiennych losowych dotyczących tego samego badanego elementu populacji (jednostki statystycznej).
    Skala ilorazowa (także: skala stosunkowa) – jeden z rodzajów skal pomiarowych. Zmienna jest na skali ilorazowej, gdy stosunki między dwiema jej wartościami mają interpretację w świecie rzeczywistym.
    Odwrotna dystrybuanta – uogólniona funkcja odwrotna do dystrybuanty danego rozkładu prawdopodobieństwa. Zwykle oznaczana Φ − 1 ( p ) {displaystyle Phi ^{-1}(p)}
    Rozkład jednostajny dyskretny – dyskretny rozkład prawdopodobieństwa w którym jednakowe prawdopodobieństwo przypisane jest do n {displaystyle n} różnych liczb rzeczywistych k 1 , … , k n {displaystyle k_{1},dots ,k_{n}} , a inne liczby mają przypisane prawdopodobieństwo zero.

    Reklama

    Czas generowania strony: 0.038 sek.