• Artykuły
  • Forum
  • Ciekawostki
  • Encyklopedia
  • Kompresja stratna



    Podstrony: 1 [2] [3] [4]
    Przeczytaj także...
    Zmienna przepływność (ang. Variable Bit Rate, VBR) jest określeniem stosowanym w telekomunikacji oraz informatyce.Sygnał to abstrakcyjny model dowolnej mierzalnej wielkości zmieniającej się w czasie, generowanej przez zjawiska fizyczne lub systemy. Tak jak wszystkie zjawiska może być opisany za pomocą aparatu matematycznego, np. poprzez podanie pewnej funkcji zależnej od czasu. Mówimy, że sygnał niesie informację lub też umożliwia przepływ strumienia informacji.

    Kompresja stratna (ang. lossy compression) – nieodwracalna metoda zmniejszenia ilości danych poprzez usunięcie przez koder-dekoder mniej istotnych danych dla zmysłów człowieka, dopuszczająca przy odtwarzaniu (dekompresji) skompresowanego sygnału, takie zniekształcenie sygnału w porównaniu do sygnału pierwotnego, powoduje że jego percepcja przez człowieka (słuch, wzrok) będzie odbierana jako identyczna lub zbliżona do oryginału, ewentualnie będzie od niego odbiegać, lecz za świadomą zgodą użytkownika. Zaletą kompresji stratnej jest uzyskiwanie wysokiego stopnia kompresji, o wiele wyższego niż w metodach kompresji bezstratnej.

    DivX – stratna metoda kompresji obrazu filmowego, w nowszych wersjach zgodna z MPEG-4 część 2, pozwalającą zapisać na zwykłej płycie kompaktowej filmy o długości ok. 90 min i jakości niewiele ustępującej DVD-Video. Wykorzystywana także do przesyłania filmów przez Internet.Vorbis - stratny kodek dźwięku z rodziny Ogg. Bardzo często używany jest w połączeniu z kontenerem Ogg i nosi wtedy nazwę Ogg Vorbis (często błędnie zapisywaną tylko jako Ogg, czy nawet jako OGG). Ogg Vorbis potrafi obsłużyć do 255 kanałów i ponad 16-bitowy dźwięk w zakresie 6-48 kHz.

    Kompresja stratna jest możliwa ze względu na sposób działania ludzkich zmysłów, czyli większą ważność dla zmysłów odbiorcy oraz pewnych zakresów danych z ich całości. Algorytmy kompresji stratnej posługują się modelami psychoakustycznymi i modelami psychowizualnymi, aby odrzucić najmniej istotne dla zmysłów odbiorcy dane akustyczne czy wizualne, pozostawiając dane o wyższej ważności dla percepcji informacji przez zmysły. Ilość odrzucanych danych jest określana przez stopień kompresji, im stopień kompresji jest większy, tym więcej danych jest usuwanych z oryginalnego materiału w procesie kompresji stratnej i wzrasta prawdopodobieństwo rozpoznania przez odbiorcę danych stratnie skompresowanych jako materiału nieoryginalnego w trakcie przeprowadzania podwójnie ślepej próby. Kompresja stratna dźwięku wykorzystuje zjawisko maskowania dźwięków, percepcji wysokości dźwięków oraz dyskryminacji bodźców dźwiękowych. Nauką zajmującą się percepcją słuchową człowieka jest psychoakustyka. Kompresja stratna obrazu wykorzystuje m.in. zjawisko znacznie niższej rozdzielczości barwowej ludzkiego oka od jego rozdzielczości jasności.

    Kompresja danych (ang. data compression) – polega na zmianie sposobu zapisu informacji tak, aby zmniejszyć redundancję i tym samym objętość zbioru. Innymi słowy chodzi o wyrażenie tego samego zestawu informacji, lecz za pomocą mniejszej liczby bitów.Słuch – zmysł umożliwiający odbieranie (percepcję) fal dźwiękowych. Narządy słuchu nazywa się uszami. Słuch jest wykorzystywany przez organizmy żywe do komunikacji oraz rozpoznawania otoczenia.

    Nie istnieją algorytmy kompresji stratnej, które można stosować do dowolnego typu danych. Kompresja stratna np. plików wykonywalnych jest niemożliwa do zastosowania, ponieważ nie jest to informacja odczytywana przez ludzkie zmysły, lecz przez maszynę.

    Zwykle kompresję stratną stosuje się do:

  • dźwięków;
  • obrazów;
  • ruchomych obrazów, jak np. film.
  • Przy danych audiowizualnych dźwięk i obraz kompresowane są osobno.

    Podpróbkowanie chrominancji – metoda kodowania obrazów polegająca na zastosowaniu mniejszej rozdzielczości dla przetwarzania informacji o chrominancji (kolorze) niż dla informacji o luminancji (jasności). Korzysta ona z niedoskonałości ludzkiego wzroku, który ma znacznie mniejszą możliwość rozpoznawania różnic w kolorze niż w jasności na tym samym obrazie. Metoda ta jest używana w wielu algorytmach kompresji danych wideo (np. MPEG) i obrazów (np. JPG), zarówno analogowych jak i cyfrowych.MP3 ((ang.) MPEG-1/MPEG-2 Audio Layer 3) – algorytm kompresji stratnej dźwięku, przetworzonego uprzednio na sygnał cyfrowy. Popularnie zwany formatem MP3 lub standardem MP3. Jest zdefiniowany przez IETF w dokumencie RFC 5219.

    Prostym przykładem kompresji stratnej obrazu jest np. zachowanie tylko co drugiego piksela, lub odrzucenie dwóch najmniej istotnych bitów. Takie metody nie dają jednak zadowalających rezultatów w porównaniu do metod opartych na modelach psychozmysłowych badanych w psychofizyce.

    Najpopularniejsze algorytmy kompresji[ | edytuj kod]

    Obraz[ | edytuj kod]

  • JPEG, podstawa algorytmu MPEG, oparty na DCT i dający relatywnie słabe rezultaty.
  • JPEG2000, oparty na falkach, dający znacznie lepsze wyniki
  • Wideo[ | edytuj kod]

  • DivX/XviD, przy odpowiednich warunkach może skompresować zawartość płyty DVD na zwykłą CD, bez widocznych różnic.
  • MPEG, jedną z jego odmian stosuje się przy filmach na DVD, bardzo wysoka jakość, połączona z większymi objętościowo plikami (100 MB DivX = ok. 350 MB MPEG).
  • Real Video, niską jakość obrazu rekompensuje mała objętość dzięki czemu wykorzystywany jest przy transmisjach na żywo.
  • Dźwięk[ | edytuj kod]

  • MP3, najpopularniejsze kodowanie stratne audio, oparte na MDCT, stosuje model psychoakustyczny Instytutu Fraunhoffera i firmy Thomson.
  • Ogg Vorbis, oparte na MDCT
  • RealAudio, rekompensuje straty jakości małą objętością, jest stosowany głównie do transmisji na żywo.
  • Zmodyfikowana dyskretna transformacja cosinusowa (MDCT, ang. Modified Discrete Cosine Transform) – blokowa transformacja danych oparta na przekształceniu kosinusowym typu DCT-IV, należąca do rodziny transformacji zakładkowych. Ta ostatnia cecha oznacza, że kolejne bloki próbek sygnału poddawane przekształceniu pobierane są nadmiarowo, z zakładką (część próbek jest wspólna), co pozwala wyeliminować tzw. efekt blokowy występujący przy zastosowaniu tej transformacji w kompresji sygnału.Model psychoakustyczny – model matematyczny, mówiący, jakie informacje o dźwięku są rozpoznawalne przez ludzkie ucho, jakie natomiast nie są. Modele psychoakustyczne są podstawą między innymi kompresji dźwięku, algorytmów oceny jakości transmisji mowy, systemów automatycznie rozpoznających mowę oraz rozpoznających mówców.


    Podstrony: 1 [2] [3] [4]




    Warto wiedzieć że... beta

    Kompresja fraktalna to system kompresji stratnej opierający się na wykorzystaniu fraktali do reprezentacji danych. Używany jest prawie wyłącznie do kompresji obrazów. Najpopularniejszym zestawem fraktali są systemy funkcji iterowanych (IFS – Iterated Functions System).
    Dyskryminacja (łac. discrimino - rozróżniam) to rozróżnianie dwóch bodźców dźwiękowych o różnym natężeniu tej samej cechy np.:
    Kompresja bezstratna (ang. lossless compression) – ogólna nazwa metod kompresji informacji do postaci zawierającej zmniejszoną liczbę bitów, pod warunkiem, że metoda ta gwarantuje możliwość odtworzenia informacji z postaci skompresowanej do identycznej postaci pierwotnej.
    Psychoakustyka – dziedzina nauki zajmująca się badaniem i opisywaniem związków zachodzących między falą dźwiękową docierającą do uszu słuchacza (bodźcem) a subiektywnie odczuwanym wrażeniem, które u niego wywołuje. Jest to nauka z pogranicza akustyki i psychologii. Działem akustyki zajmującym się psychoakustyką jest akustyka słuchu, natomiast działem psychologii jest psychologia poznawcza. Dziedzinami, do których stale odwołuje się psychoakustyka są również anatomia, neuropsychologia oraz fizjologia.
    RealAudio – format kompresji dźwięku stworzony przez firmę RealNetworks. Kodek został opracowany głównie z myślą o wykorzystaniu go w strumieniowaniu dźwięku przy łączu internetowym o niskiej przepustowości. Wiele internetowych stacji radiowych korzysta z RealAudio przy transmitowaniu audycji przez Internet.
    Kodek jest skrótem od "koder/dekoder", co oznacza urządzenie lub program zdolny do przekształcania strumienia danych lub sygnału. Kodeki mogą zmienić strumień danych w formę zakodowaną (często w celu transmisji, składowania lub zaszyfrowania) lub odzyskać (odkodować) strumień danych z formy zakodowanej, by umożliwić ich odtwarzanie bądź obróbkę. Kodeki są często używane w wideokonferencjach oraz strumieniowaniu obrazu lub dźwięku.
    Ogg - format kontenera strumieni danych, opracowany przez fundację Xiph.org, stworzony by wspierać inicjatywy związane z rozwojem wolnego oprogramowania do kodowania i dekodowania multimediów.

    Reklama

    Czas generowania strony: 0.028 sek.