• Artykuły
  • Forum
  • Ciekawostki
  • Encyklopedia
  • Model statystyczny



    Podstrony: 1 [2] [3] [4] [5]
    Przeczytaj także...
    Rozkład normalny, zwany też rozkładem Gaussa – jeden z najważniejszych rozkładów prawdopodobieństwa. Odgrywa ważną rolę w statystycznym opisie zagadnień przyrodniczych, przemysłowych, medycznych, społecznych itp. Wykres funkcji prawdopodobieństwa tego rozkładu jest krzywą dzwonową.Metoda najmniejszych kwadratów – standardowa metoda przybliżania rozwiązań układów nadokreślonych, tzn. zestawu równań, w którym jest ich więcej niż zmiennych. Nazwa „najmniejsze kwadraty” oznacza, że końcowe rozwiązanie tą metodą minimalizuje sumę kwadratów błędów przy rozwiązywaniu każdego z równań.

    Model statystycznyhipoteza lub układ hipotez, sformułowanych w sposób matematyczny (odpowiednio w postaci równania lub układu równań), który przedstawia zasadnicze powiązania występujące pomiędzy rozpatrywanymi zjawiskami rzeczywistymi.

    Bardziej formalnie jest to parametryzowana rodzina rozkładów łącznych rozważanych zmiennych, stąd druga nazwa przestrzeń statystyczna.

    Modele statystyczne używane w ekonometrii noszą nazwę modeli ekonometrycznych.

    Rozkład prawdopodobieństwa – w najczęstszej interpretacji (rozkład zmiennej losowej) miara probabilistyczna określona na sigma-ciele podzbiorów zbioru wartości zmiennej losowej (wektora losowego), pozwalająca przypisywać prawdopodobieństwa zbiorom wartości tej zmiennej, odpowiadającym zdarzeniom losowym. Formalnie rozkład prawdopodobieństwa może być jednak rozpatrywany także bez stosowania zmiennych losowych.Estymacja to dział wnioskowania statystycznego będący zbiorem metod pozwalających na uogólnianie wyników badania próby losowej na nieznaną postać i parametry rozkładu zmiennej losowej całej populacji oraz szacowanie błędów wynikających z tego uogólnienia. Wyrażenie nieznana postać jest kluczem do odróżnienia estymacji od drugiego działu wnioskowania statystycznego, jakim jest weryfikacja hipotez statystycznych, w którym najpierw stawiamy przypuszczenia na temat rozkładu, a następnie sprawdzamy ich poprawność.

    Formalna definicja matematyczna[ | edytuj kod]

    Niech

    Test statystyczny - formuła matematyczna pozwalająca oszacować prawdopodobieństwo spełnienia pewnej hipotezy statystycznej w populacji na podstawie próby losowej z tej populacji.Kryterium informacyjne Akaikego – zaproponowane przez H. Akaikego kryterium wyboru pomiędzy modelami statystycznymi o różnej liczbie predyktorów. Na ogół model o większej liczbie predyktorów daje dokładniejsze przewidywania, jednak ma też większą skłonność do przeuczenia.

    będzie rodziną rozkładów prawdopodobieństwa określonych na przestrzeni próby indeksowaną parametrem (w szczególności może to być wektor parametrów rzeczywistych). opisuje wielowymiarowy łączny rozkład wszystkich obserwacji w próbie

    Odchylenie standardowe – klasyczna miara zmienności, obok średniej arytmetycznej najczęściej stosowane pojęcie statystyczne.Statystyka (niem. Statistik, „badanie faktów i osób publicznych”, z łac. [now.] statisticus, „polityczny, dot. polityki”, od status, „państwo, stan”) – nauka, której przedmiotem zainteresowania są metody pozyskiwania i prezentacji, a przede wszystkim analizy danych opisujących zjawiska, w tym masowe.

    Formalnie model statystyczny to para:

    Niech próba opisywana przez rozkład będzie wektorem niezależnych zmiennych losowych z których każda ma rozkład a jej zbiorem wartości jest nazywany jest -elementową próbą z rozkładu

    Metoda Hellwiga, zwana również metodą optymalnego wyboru predyktant, metodą wskaźników pojemności informacji – formalna metoda doboru zmiennych objaśniających do modelu statystycznego (w szczególności modelu ekonometrycznego) stworzona w 1969 roku przez Zdzisława Hellwiga.Heteroskedastyczność (lub heteroscedastyczność) to pojęcie z zakresu statystyki odnoszące się do ciągu lub wektora zmiennych losowych. Własność ta jest zaprzeczeniem posiadania przez taki ciąg lub wektor własności homoskedastyczności, tzn. przynajmniej jedna zmienna losowa z ciągu różni się od innych wariancją lub jej wariancja jest nieskończona. Heteroskedastyczność rozważa się w kontekście modeli ekonometrycznych, szczególnie przy estymacji metodą najmniejszych kwadratów, ze względu na jedno z założeń Klasycznego Modelu Regresji Liniowej, mówiącego o homoskedastyczności wariancji składnika losowego. Możemy wyróżnić heteroskedastyczność addytywną, gdy wariancja składnika losowego jest funkcją afiniczną zmiennych wpływających na jej wielkość, oraz heteroskedastyczność multiplikatywną, gdy wariancja przyjmuje postać wykładniczą.

    W takim przypadku stosowany jest również zapis

    W praktycznych zastosowaniach podaje się po prostu warunek, jaki spełniają rozkłady z rodziny Zmienne losowe występujące w tym warunku determinują przestrzeń próby a parametry tworzą wektor

    Modelowanie matematyczne to użycie języka matematyki do opisania zachowania jakiegoś układu (na przykład układu automatyki, biologicznego, ekonomicznego, elektrycznego, mechanicznego, termodynamicznego).Liczba stopni swobody, df (ang. degrees of freedom) – liczba niezależnych wyników obserwacji pomniejszona o liczbę związków, które łączą te wyniki ze sobą.

    Model nieparametryczny[ | edytuj kod]

    Model nieparametryczny to model w którym nie istnieje skończenie wymiarowa parametryzacja rodziny rozkładów, czyli nie da się go zapisać w takiej postaci, że

    Nie oznacza to braku jakiejkolwiek parametryzacji – to byłoby sprzeczne z definicją modelu statystycznego – np. może być rodziną dystrybuant.

    Regresja − metoda statystyczna pozwalająca na badanie związku pomiędzy wielkościami danych i przewidywanie na tej podstawie nieznanych wartości jednych wielkości na podstawie znanych wartości innych.Hipoteza (gr. hypóthesis – przypuszczenie) – osąd, który podlega weryfikacji lub falsyfikacji. Zdanie, które stwierdza spodziewaną relację między jakimiś zjawiskami, propozycja twierdzenia naukowego, które zakłada możliwą lub oczekiwaną w danym kontekście sytuacyjnym naturę związku.

    Model identyfikowalny[ | edytuj kod]

    Jeśli zachodzi:

    to model nazywany jest identyfikowalnym. Oznacza to, że parametr jest jednoznacznie wyznaczony przez rozkład

    Ekonometria – nauka pomocnicza w ramach ekonomii, wykorzystująca narzędzia matematyki, statystyki oraz informatyki do badania ilościowych związków zachodzących między zjawiskami i zmiennymi ekonomicznymi. Jest zbiorem metod opracowanych najczęściej poza ekonomią, ale wykorzystywanych na jej polu.Regresja liniowa – metoda estymowania wartości oczekiwanej zmiennej y {displaystyle y} przy znanych wartościach innej zmiennej lub zmiennych x {displaystyle x} . Szukana zmienna y {displaystyle y} jest tradycyjnie nazywana zmienną objaśnianą lub zależną. Inne zmienne x {displaystyle x} nazywa się zmiennymi objaśniającymi lub niezależnymi. Zarówno zmienne objaśniane i objaśniające mogą być wielkościami skalarnymi lub wektorami.

    Modele liniowe[ | edytuj kod]

    Ogólna postać liniowego modelu o G równaniach łącznie współzależnych i tylu zmiennych endogenicznych (objaśnianych) oraz K dodatkowych zmiennych egzogenicznych (objaśniających) przy liczbie t obserwacji:

    Współczynnik determinacji R – jedna z podstawowych miar jakości dopasowania modelu. Powiązany z tym współczynnikiem jest współczynnik zbieżności.Wektor (z łac. [now.], „niosący; ten, który niesie; nośnik”, od vehere, „nieść”; via, „droga”) – istotny w matematyce elementarnej, inżynierii i fizyce obiekt mający moduł (zwany też – zdaniem niektórych niepoprawnie - długością lub wartością), kierunek wraz ze zwrotem (określającym orientację wzdłuż danego kierunku).

    Zmienna objaśniająca / egzogeniczna / zewnętrzna / predyktor – jest to zmienna w modelu statystycznym (czyli także np. w modelu ekonometrycznym), na podstawie której wylicza się zmienną objaśnianą (endogeniczną). Zmiennych objaśniających zwykle występuje wiele w jednym modelu.Odchylenie standardowe składnika resztowego – jedna ze statystycznych miar jakości prognozy. Wartość odchylenia standardowego reszt s informuje, jakie są przeciętne odchylenia wartości rzeczywistych zmiennej prognozowanej od teoretycznych. Im mniejsza jest wartość tego miernika, tym lepsza jakość modelu. Odchylenie standardowe składnika resztowego wyraża się wzorem:

    Zmienna losowa – funkcja przypisująca zdarzeniom elementarnym liczby. Intuicyjnie: odwzorowanie przenoszące badania prawdopodobieństwa z niewygodnej przestrzeni probabilistycznej do dobrze znanej przestrzeni euklidesowej. Zmienne losowe to funkcje mierzalne względem przestrzeni probabilistycznych.Współczynnik zmienności to klasyczna miara zróżnicowania rozkładu cechy. W odróżnieniu od odchylenia standardowego, które określa bezwzględne zróżnicowanie cechy, współczynnik zmienności jest miarą względną, czyli zależną od wielkości średniej arytmetycznej. Definiowany jest wzorem:

    Linia trendu[ | edytuj kod]

    Najprostszym modelem stosowanym w prognozie jest linia trendu, w której zakładamy następującą zależność między zmienną objaśniającą (oznaczającą czas) a zmienną objaśnianą

    Błąd przypadkowy (błąd losowy) – rodzaj błędu pomiaru, nie wynikający z czynników systematycznych, powtarzalnych. Nie można z góry przewidzieć jego wartości w kolejnych pomiarach. Informację na temat skali występowania tego błędu można uzyskać po wykonaniu serii pomiarów i wyliczeniu wybranej miary zróżnicowania rozkładu, np. odchylenia standardowego.Wartość oczekiwana (wartość średnia, przeciętna, dawniej nadzieja matematyczna) – w rachunku prawdopodobieństwa wartość określająca spodziewany wynik doświadczenia losowego. Wartość oczekiwana to inaczej pierwszy moment zwykły. Estymatorem wartości oczekiwanej rozkładu cechy w populacji jest średnia arytmetyczna.

    gdzie: – stałe współczynniki, błąd losowy o rozkładzie normalnym i wartości oczekiwanej zero.

    Liniowy model prawdopodobieństwa[ | edytuj kod]

    Jako przykład klasycznych modeli liniowych rozpatrywanych w statystyce wskazać można również liniowy model prawdopodobieństwa (LMP), tj. najprostszy model regresji pozwalający prognozować występowalność rozpatrywanego zdarzenia. Model ten przyjmuje postać:

    Metoda Pawłowskiego - metoda doboru zmiennych objaśniających do modelu statystycznego (w szczególności modelu ekonometrycznego) stworzona przez Z. Pawłowskiego.Poziom istotności – jest to maksymalne dopuszczalne prawdopodobieństwo popełnienia błędu I rodzaju (zazwyczaj oznaczane symbolem α). Określa tym samym maksymalne ryzyko błędu, jakie badacz jest skłonny zaakceptować. Wybór wartości α zależy od badacza, natury problemu i od tego, jak dokładnie chce on weryfikować swoje hipotezy, najczęściej przyjmuje się α = 0,05; rzadziej 0,1, 0,03, 0,01 lub 0,001. Wartość założonego poziomu istotności jest porównywana z wyliczoną z testu statystycznego p-wartością (czasem porównuje się od razu wartości statystyki testowej z wartością odpowiadającą danemu poziomowi istotności). Jeśli p-wartość jest większa, oznacza to, iż nie ma powodu do odrzucenia tzw. hipotezy zerowej H0, która zwykle stwierdza, że obserwowany efekt jest dziełem przypadku.

    gdzie:

    Funkcja Cobba-Douglasa to funkcyjne przedstawienie zależności produkcji od zasobów pracy i kapitału, często stosowane w ekonomii jako funkcja produkcji. Została sformułowana przez Knuta Wicksella i przetestowana na danych statystycznych przez Paula Douglasa i Charlesa Cobba w 1928.Dystrybuanta (fr. distribuer „rozdzielać, rozdawać”) – w rachunku prawdopodobieństwa, statystyce i dziedzinach pokrewnych, funkcja rzeczywista jednoznacznie wyznaczająca rozkład prawdopodobieństwa (tj. miarę probabilistyczną określoną na σ-ciele borelowskich podzbiorów prostej), a więc zawierająca wszystkie informacje o tym rozkładzie. Dystrybuanty są efektywnym narzędziem badania prawdopodobieństwa, ponieważ są obiektami prostszymi niż rozkłady prawdopodobieństwa. W statystyce dystrybuanta rozkładu próby zwana jest dystrybuantą empiryczną i jest blisko związana z pojęciem rangi.
    – reprezentująca rozpatrywane zjawisko zmienna objaśniana, – zmienne objaśniające, – parametry modelu, – odchylenie losowe modelu.

    LMP szacować metodą najmniejszych kwadratów (MNK), jednakże nie zostaną w jego przypadku spełnione klasyczne warunki stosowalności MNK – determinuje to podstawowe wady modelu, do których zalicza się:

    Macierz – w matematyce układ liczb, symboli lub wyrażeń zapisanych w postaci prostokątnej tablicy. Choć słowo „macierz” oznacza najczęściej macierz dwuwskaźnikową, to możliwe jest rozpatrywanie macierzy wielowskaźnikowych (zob. notacja wielowskaźnikowa). Macierze jednowskaźnikowe nazywa się często wektorami wierszowymi lub kolumnowymi, co wynika z zastosowań macierzy w algebrze liniowej. W informatyce macierze modeluje się zwykle za pomocą (najczęściej dwuwymiarowych) tablic.Homoskedastyczność (lub homoscedastyczność) to pojęcie z zakresu statystyki odnoszące się do ciągu lub wektora zmiennych losowych. Taki ciąg lub wektor posiada własność homoskedastyczności, jeśli wszystkie zmienne losowe w tym ciągu posiadają tę samą, skończoną wariancję. Założenie to często umożliwia uproszczenie modelu i obliczeń i jest stosowane często nawet wtedy, gdy nie jest prawdziwe. Stosuje się je między innymi w metodzie najmniejszych kwadratów.
  • możliwość wykroczenia zmiennej zależnej poza wartości z przedziału <0; 1>;
  • heteroskedastyczność – brak homoskedastyczności przekłada się na błędne wyniki statystyki testowej (oszacowania modelu mogą zostać skorygowane w tym zakresie za pomocą uogólnionej metody najmniejszych kwadratów);
  • niespełnienie warunku normalności rozkładu reszt – reszty modelu nie mają rozkładu zgodnego z rozkładem normalnym.
  • DOI (ang. digital object identifier – cyfrowy identyfikator dokumentu elektronicznego) – identyfikator dokumentu elektronicznego, który w odróżnieniu od identyfikatorów URL nie zależy od fizycznej lokalizacji dokumentu, lecz jest do niego na stałe przypisany.Regresja logistyczna – jedna z metod regresji używanych w statystyce w przypadku, gdy zmienna objaśniana jest na skali dychotomicznej (przyjmuje tylko dwie wartości).


    Podstrony: 1 [2] [3] [4] [5]




    Warto wiedzieć że... beta

    Średnia - w najogólniejszej wersji dowolna funkcja Parser nie mógł rozpoznać(nieznany błąd): mu (a_{{1}},ldots ,a_{{n}})
    International Standard Serial Number, ISSN czyli Międzynarodowy Znormalizowany Numer Wydawnictwa Ciągłego – ośmiocyfrowy niepowtarzalny identyfikator wydawnictw ciągłych tradycyjnych oraz elektronicznych. Jest on oparty na podobnej koncepcji jak identyfikator ISBN dla książek, ISAN dla materiałów audio-wideo. Niektóre publikacje wydawane w seriach mają przyporządkowany zarówno numer ISSN, jak i ISBN.
    Metoda analizy grafów (Metoda Bartosiewicz) - graficzna konstrukcja wyrażająca powiązania pomiędzy zmiennymi objaśniającymi wyrażona za pomocą węzłów, oraz łączących je łuków.
    Matematyka (z łac. mathematicus, od gr. μαθηματικός mathēmatikós, od μαθηματ-, μαθημα mathēmat-, mathēma, „nauka, lekcja, poznanie”, od μανθάνειν manthánein, „uczyć się, dowiedzieć”; prawd. spokr. z goc. mundon, „baczyć, uważać”) – nauka dostarczająca narzędzi do otrzymywania ścisłych wniosków z przyjętych założeń, zatem dotycząca prawidłowości rozumowania. Ponieważ ścisłe założenia mogą dotyczyć najróżniejszych dziedzin myśli ludzkiej, a muszą być czynione w naukach ścisłych, technice a nawet w naukach humanistycznych, zakres matematyki jest szeroki i stale się powiększa.
    Bayesowskie kryterium informacyjne Schwartza (BIC - od ang. Bayesian Information Criterion) – w modelowaniu równań strukturalnych jest to jeden ze wskaźników dopasowania modelu. Twórcą wskaźnika jest Gideon Schwarz, który przedstawił ten wskaźnik w artykule z 1978 r. pt. Estimating the Dimension of a Model.
    Zmienna objaśniana (zmienna endogeniczna, zmienna odpowiedzi, zmienna prognozowana, zmienna wewnętrzna) – jest to zmienna, której wartości są estymowane przez model statystyczny (w szczególności model ekonometryczny). Jej przeciwieństwem jest zmienna objaśniająca / egzogeniczna.

    Reklama

    Czas generowania strony: 0.067 sek.