• Artykuły
  • Forum
  • Ciekawostki
  • Encyklopedia
  • Eksploracja danych



    Podstrony: [1] [2] 3 [4]
    Przeczytaj także...
    Uczenie maszynowe albo uczenie się maszyn, systemy uczące się (ang. machine learning) – stosunkowo młoda i szybko rozwijająca się dziedzina wchodząca w skład nauk zajmujących się problematyką SI (patrz sztuczna inteligencja).Medycyna (łac. medicina „sztuka lekarska”) – nauka empiryczna (oparta na doświadczeniu) obejmująca całość wiedzy o zdrowiu i chorobach człowieka oraz sposobach ich zapobiegania, oraz ich leczenia. Medycyna weterynaryjna rozszerza zakres zainteresowań medycyny na stan zdrowia zwierząt. Za prekursora medycyny starożytnej uważa się Hipokratesa, a nowożytnej Paracelsusa. W czasach najnowszych wprowadza się zasady medycyny opartej na faktach.
    Obszar stosowania[]

    Obszarów stosowania eksploracji danych jest wiele, obejmują one te miejsca, w których stosuje się systemy informatyczne, między innymi w celu gromadzenia pozyskanych danych w postaci baz danych. Jesteśmy świadkami prawdziwej eksplozji baz danych, mając na myśli ich liczbę i objętość. Ogromne zbiory danych gromadzone są w hurtowniach danych. Z powodu dużej prostoty konstruowania bazy danych oraz akceptowalnych cen, systemy gromadzące dane stosuje się prawie we wszystkich dziedzinach życia. Wszędzie tam natomiast, gdzie istnieje już baza danych, pojawia się potrzeba analizy tych danych w celu odkrycia nieznanej dotąd wiedzy. Dziedziny, w których szeroko stosuje się eksplorację danych to: technika, medycyna, astronomia, ekonomia, szeroko pojęty biznes.

    Statystyka (niem. Statistik, „badanie faktów i osób publicznych”, z łac. [now.] statisticus, „polityczny, dot. polityki”, od status, „państwo, stan”) – nauka, której przedmiotem zainteresowania są metody pozyskiwania i prezentacji, a przede wszystkim analizy danych opisujących zjawiska, w tym masowe.Klasyfikacja – systematyczny podział przedmiotów lub zjawisk na klasy, działy, poddziały, wykonywany według określonej zasady.

    Zastosowania KDD znajdują zastosowania przy:

  • eksploracji danych o ruchu internetowym,
  • rozpoznawaniu sygnałów obrazu, mowy, pisma,
  • wspomaganiu diagnostyki medycznej,
  • badaniach genetycznych,
  • analizie operacji bankowych,
  • projektowaniu hurtowni danych,
  • tworzeniu reklam skierowanych(ang. Targeted ads),
  • prognozowaniu sprzedaży(ang. Sales forecast),
  • wdrażaniu strategii Cross-selling'owej,
  • wykrywaniu nadużyć(ang. Fraud detection),
  • ocenie ryzyka kredytowego,
  • segmentacji klientów.
  • Przykładem może być odkrycie w danych z supermarketu zależności polegającej na tym że klient, który kupuje szampana i kwiaty, kupuje zwykle również czekoladki.

    Wydział Matematyki, Informatyki i Mechaniki Uniwersytetu Warszawskiego (WMIM UW, MIMUW) – wydział Uniwersytetu Warszawskiego kształcący w trybie dziennym na kierunkach:Komputer (z ang. computer od łac. computare – liczyć, sumować; dawne nazwy używane w Polsce: mózg elektronowy, elektroniczna maszyna cyfrowa, maszyna matematyczna) – maszyna elektroniczna przeznaczona do przetwarzania informacji, które da się zapisać w formie ciągu cyfr albo sygnału ciągłego.

    Przykłady wizualizacji[]

    Gęstość[]

    Wykresy rozkładów empirycznych dla wybranych zmiennych predykcyjnych są tym lepsze im linie obrazujące poszczególne klasy są względem siebie znacząco przesunięte. W sytuacji, gdy się na siebie nakładają, praktycznie nie ma możliwości wyznaczenia do jakiej klasy należą.

    Density Cauchy.png


    Ekonomia – nauka społeczna analizująca oraz opisująca produkcję, dystrybucję oraz konsumpcję dóbr. Słowo „ekonomia” wywodzi się z języka greckiego i tłumaczy się jako oikos, co znaczy dom i nomos, czyli prawo, reguła. Starożytni Grecy stosowali tę definicję do określania efektywnych zasad funkcjonowania gospodarstwa domowego.Analiza koszykowa, jest metodą z zakresu eksploracji danych, tworzącą dla zbioru danych zestaw opisujących go przybliżonych reguł asocjacyjnych typu "Jeżeli poprzednik to zwykle następnik", gdzie poprzednik i następnik to wyrażenia logiczne, np.

    Wykres pudełkowy[]

    Celem obrazowania właściwości poszczególnych cech na wykresach pudełkowych jest wyłonienie takich zmiennych, które charakteryzują się największymi przesunięciami względem siebie kwantyli, wartości maksymalnych, minimalnych oraz median.

    Michelsonmorley-boxplot.svg


    Histogram[]

    Histogramy dla wybranych zmiennych predykcyjnych są tym lepsze im słupki są bardziej zróżnicowane. W sytuacji, gdy się na siebie nakładają, praktycznie nie ma możliwości wyznaczenia do jakiej klasy należą.

    Wiedza – termin używany powszechnie, istnieje wiele definicji tego pojęcia. Nowa Encyklopedia Powszechna definiuje wiedzę jako „ogół wiarygodnych informacji o rzeczywistości wraz z umiejętnością ich wykorzystywania”.Teoria zbiorów przybliżonych – zaproponowany w 1982 r. przez prof. Zdzisława Pawlaka formalizm matematyczny, stanowiący rozwinięcie klasycznej teorii zbiorów. Zbiór przybliżony (ang. rough set) to obiekt matematyczny zbudowany w oparciu o logikę trójwartościową. W swym pierwotnym ujęciu zbiór przybliżony to para klasycznych zbiorów: przybliżenie dolne i przybliżenie górne. Istnieje również odmiana zbioru przybliżonego, definiowana przez parę przybliżeń będących zbiorami rozmytymi (ang. fuzzy set). Dany element może należeć do obydwu przybliżeń, do żadnego lub tylko do przybliżenia górnego. Ten ostatni przypadek jest o tyle ciekawy, że pozwala na modelowanie niepewności.
    Histogram example.svg


    Co można odczytać z wykresów?[]

    Tabelka przedstawia jakie dane można odczytać z poszczególnych wykresów.

    Podstrony: [1] [2] 3 [4]



    w oparciu o Wikipedię (licencja GFDL, CC-BY-SA 3.0, autorzy, historia, edycja)

    Warto wiedzieć że... beta

    Astronomia (gr. ἀστρονομία astronomía) – nauka przyrodnicza zajmująca się badaniem ciał niebieskich (np. gwiazd, planet, komet, mgławic, gromad i galaktyk) oraz zjawisk, które zachodzą poza Ziemią, jak również tych, które oddziałują w jej atmosferze, wnętrzu lub na powierzchni, a są pochodzenia pozaplanetarnego (np. neutrina, wtórne promieniowanie kosmiczne). Skoncentrowana jest na fizyce, chemii, meteorologii i ruchu ciał niebieskich, zajmuje się także powstaniem i rozwojem (ewolucją) Wszechświata.
    Baza danych – zbiór danych zapisanych zgodnie z określonymi regułami. W węższym znaczeniu obejmuje dane cyfrowe gromadzone zgodnie z zasadami przyjętymi dla danego programu komputerowego specjalizowanego do gromadzenia i przetwarzania tych danych. Program taki (często pakiet programów) nazywany jest „systemem zarządzania bazą danych” (ang. database management system, DBMS).
    Sieć neuronowa (sztuczna sieć neuronowa) – ogólna nazwa struktur matematycznych i ich programowych lub sprzętowych modeli, realizujących obliczenia lub przetwarzanie sygnałów poprzez rzędy elementów, zwanych sztucznymi neuronami, wykonujących pewną podstawową operację na swoim wejściu. Oryginalną inspiracją takiej struktury była budowa naturalnych neuronów, łączących je synaps, oraz układów nerwowych, w szczególności mózgu.
    Algorytm – w matematyce skończony ciąg jasno zdefiniowanych czynności, koniecznych do wykonania pewnego rodzaju zadań. Słowo "algorytm" pochodzi od starego angielskiego słowa algorism, oznaczającego wykonywanie działań przy pomocy liczb arabskich (w odróżnieniu od abacism – przy pomocy abakusa), które z kolei wzięło się od nazwiska, które nosił Muhammad ibn Musa al-Chuwarizmi (أبو عبد الله محمد بن موسى الخوارزمي), matematyk perski z IX wieku.
    System informatyczny – jest to zbiór powiązanych ze sobą elementów, którego funkcją jest przetwarzanie danych przy użyciu techniki komputerowej. Na systemy informatyczne składają się obecnie takie elementy jak:
    Logika rozmyta (ang. fuzzy logic), jedna z logik wielowartościowych (ang. multi-valued logic), stanowi uogólnienie klasycznej dwuwartościowej logiki. Została zaproponowana przez Lotfi Zadeha, jest ściśle powiązana z jego teorią zbiorów rozmytych. W logice rozmytej między stanem 0 (fałsz) a stanem 1 (prawda) rozciąga się szereg wartości pośrednich, które określają stopień przynależności elementu do zbioru.
    Hurtownia danych (ang. data warehouse) – rodzaj bazy danych, która jest zorganizowana i zoptymalizowana pod kątem pewnego wycinka rzeczywistości.

    Reklama

    Czas generowania strony: 0.025 sek.