• Artykuły
  • Forum
  • Ciekawostki
  • Encyklopedia
  • Kompresja stratna



    Podstrony: [1] 2 [3] [4]
    Przeczytaj także...
    Zmienna przepływność (ang. Variable Bit Rate, VBR) jest określeniem stosowanym w telekomunikacji oraz informatyce.Sygnał to abstrakcyjny model dowolnej mierzalnej wielkości zmieniającej się w czasie, generowanej przez zjawiska fizyczne lub systemy. Tak jak wszystkie zjawiska może być opisany za pomocą aparatu matematycznego, np. poprzez podanie pewnej funkcji zależnej od czasu. Mówimy, że sygnał niesie informację lub też umożliwia przepływ strumienia informacji.
    Kompresja grafiki[ | edytuj kod]

    JPEG[ | edytuj kod]

    Najbardziej powszechnym algorytmem kompresji obrazów jest JPEG. Wiele rozwiązań użytych w JPEG jest używanych także w innych algorytmach, więc warto je tutaj omówić. Kolejne kroki algorytmu JPEG to:

    1. zamiana przestrzeni kolorów z RGB na kanał jasności i dwa kanały koloru. Ludzie znacznie dokładniej postrzegają drobne różnice jasności od drobnych różnic barwy, a więc użyteczne jest tutaj użycie różnych parametrów kompresji. Krok nie jest obowiązkowy.
    2. obniżenie rozdzielczości kanałów koloru (podpróbkowanie chrominancji), zwykle brana jest co druga wartość wzdłuż osi poziomej i każda na pionowej, choć możliwe są też inne ustawienia. Tak radykalne cięcie danych nieznacznie wpływa na jakość, ponieważ rozdzielczość postrzegania kolorów przez ludzkie oko jest słaba. Krok nie jest obowiązkowy.
    3. podzielenie każdego kanału obrazka na bloki 8×8. W przypadku kanałów kolorów, jest to 8×8 rzeczywistych danych, a więc zwykle 16×8.
    4. transformata kosinusowa każdego z bloków. Zamiast wartości pikseli mamy teraz średnią wartość wewnątrz bloku oraz częstotliwości zmian wewnątrz bloku, obie wyrażone przez liczby zmiennoprzecinkowe. Transformata DCT jest odwracalna, więc na razie nie tracimy żadnych danych.
    5. Zastąpienie średnich wartości bloków przez różnice wobec wartości poprzedniej. Poprawia to w pewnym stopniu współczynnik kompresji.
    6. Kwantyzacja, czyli zastąpienie danych zmiennoprzecinkowych przez liczby całkowite. Tutaj właśnie następuje utrata precyzji danych. Zależnie od parametrów kompresora, odrzuca się mniej lub więcej danych. Zasadniczo większa dokładność jest stosowana do danych dotyczących niskich częstotliwości niż wysokich, kodowanych algorytmem Huffmana.

    Użyta transformata powoduje efekty blokowe w przypadku mocno skompresowanych obrazków.

    DivX – stratna metoda kompresji obrazu filmowego, w nowszych wersjach zgodna z MPEG-4 część 2, pozwalającą zapisać na zwykłej płycie kompaktowej filmy o długości ok. 90 min i jakości niewiele ustępującej DVD-Video. Wykorzystywana także do przesyłania filmów przez Internet.Vorbis - stratny kodek dźwięku z rodziny Ogg. Bardzo często używany jest w połączeniu z kontenerem Ogg i nosi wtedy nazwę Ogg Vorbis (często błędnie zapisywaną tylko jako Ogg, czy nawet jako OGG). Ogg Vorbis potrafi obsłużyć do 255 kanałów i ponad 16-bitowy dźwięk w zakresie 6-48 kHz.

    Inne metody[ | edytuj kod]

    Inne algorytmy kompresji obrazków opierają się głównie na:

  • użyciu innej transformaty:
  • zmodyfikowanej transformaty kosinusowej, która nie powoduje efektu bloków, a więc jest korzystniejsza w przypadku mocno skompresowanych obrazków. Nie odbiega ona wynikami znacząco od DCT w przypadku obrazów o średniej i niskiej kompresji;
  • transformat falkowych – mogą one dać znacznie lepsze wyniki. Zazwyczaj nie powodują efektu bloków;
  • użyciu innego algorytmu kompresji bezstratnej;
  • kompresji wszystkich kanałów naraz, w szczególności ich wspólnej kwantyzacji. Daje lepsze wyniki jeśli wartości w różnych kanałach są mocno skorelowane.
  • Kompresja fraktalna[ | edytuj kod]

    Zupełnie inną metodą jest kompresja fraktalna. Opisuje ona obraz w postaci parametrów funkcji fraktalnej, która daje w efekcie przybliżoną postać obrazu. Dotychczas kompresja fraktalna daje znacznie słabszą jakość w przypadku obrazów o niskim i średnim stopniu kompresji. Dla obrazów silnie skompresowanych może dawać lepsze rezultaty niż JPEG, przede wszystkim nie powoduje efektu bloków, jednak są one słabsze od znacznie prostszych metod opartych na MDCT czy falkach. Nic nie wskazuje na to, że kompresja fraktalna znajdzie szersze zastosowanie.

    Kompresja danych (ang. data compression) – polega na zmianie sposobu zapisu informacji tak, aby zmniejszyć redundancję i tym samym objętość zbioru. Innymi słowy chodzi o wyrażenie tego samego zestawu informacji, lecz za pomocą mniejszej liczby bitów.Słuch – zmysł umożliwiający odbieranie (percepcję) fal dźwiękowych. Narządy słuchu nazywa się uszami. Słuch jest wykorzystywany przez organizmy żywe do komunikacji oraz rozpoznawania otoczenia.

    Kompresja ruchomych obrazów[ | edytuj kod]

    Najprostsze systemy kompresji ruchomych obrazów po prostu kompresują każdą klatkę osobno. Jest to bardzo nieefektywne, ponieważ kolejne klatki są zazwyczaj do siebie bardzo podobne.

    Zwykle używa się zestawu klatek kluczowych, które kompresuje się tak samo, jak samodzielne obrazki. Pozostałe klatki kompresuje się natomiast, korzystając z danych z klatek poprzednich. Lepsze wyniki dałoby wykorzystanie danych o poprzednich klatkach przy kompresji każdej klatki, jednak utrudniałoby to znacznie przewijanie.

    Podpróbkowanie chrominancji – metoda kodowania obrazów polegająca na zastosowaniu mniejszej rozdzielczości dla przetwarzania informacji o chrominancji (kolorze) niż dla informacji o luminancji (jasności). Korzysta ona z niedoskonałości ludzkiego wzroku, który ma znacznie mniejszą możliwość rozpoznawania różnic w kolorze niż w jasności na tym samym obrazie. Metoda ta jest używana w wielu algorytmach kompresji danych wideo (np. MPEG) i obrazów (np. JPG), zarówno analogowych jak i cyfrowych.MP3 ((ang.) MPEG-1/MPEG-2 Audio Layer 3) – algorytm kompresji stratnej dźwięku, przetworzonego uprzednio na sygnał cyfrowy. Popularnie zwany formatem MP3 lub standardem MP3. Jest zdefiniowany przez IETF w dokumencie RFC 5219.

    Prostym sposobem wykorzystania danych o poprzednich klatkach jest kodowanie różnicy wartości pikseli o tym samym położeniu, zamiast samych wartości. Tym sposobem można dobrze skompresować sceny, w których kamera jest nieruchoma, jednak nie da to znaczących efektów w scenach z kamerą ruchomą. Zwykle wykorzystuje się więc różne rodzaje kompensacji ruchu. Np. dla każdego bloku podaje się niewielki wektor przesunięcia, np. [2, –1], czyli zamiast tego samego bloku klatki poprzedniej używamy bloku o dwa piksele w prawo i jeden w górę (czy też w lewo i w dół).

    Zmodyfikowana dyskretna transformacja cosinusowa (MDCT, ang. Modified Discrete Cosine Transform) – blokowa transformacja danych oparta na przekształceniu kosinusowym typu DCT-IV, należąca do rodziny transformacji zakładkowych. Ta ostatnia cecha oznacza, że kolejne bloki próbek sygnału poddawane przekształceniu pobierane są nadmiarowo, z zakładką (część próbek jest wspólna), co pozwala wyeliminować tzw. efekt blokowy występujący przy zastosowaniu tej transformacji w kompresji sygnału.Model psychoakustyczny – model matematyczny, mówiący, jakie informacje o dźwięku są rozpoznawalne przez ludzkie ucho, jakie natomiast nie są. Modele psychoakustyczne są podstawą między innymi kompresji dźwięku, algorytmów oceny jakości transmisji mowy, systemów automatycznie rozpoznających mowę oraz rozpoznających mówców.

    Inną ważną techniką wykorzystywaną przy kompresji obrazów ruchomych jest zmienna przepływność (variable bitrate), czyli używanie różnej dokładności dla różnych klatek. Jest wiele sposobów dobierania takich różnic; algorytmy wyboru jakości zwykle są cechą bardziej enkodera, niż formatu. Często enkodery stosują metody dwu-przejazdowe. Pierwszy przejazd po danych zbiera informacje potrzebne algorytmowi zmiennej przepływności, a dopiero drugi kompresuje dane.

    Kompresja fraktalna to system kompresji stratnej opierający się na wykorzystaniu fraktali do reprezentacji danych. Używany jest prawie wyłącznie do kompresji obrazów. Najpopularniejszym zestawem fraktali są systemy funkcji iterowanych (IFS – Iterated Functions System).Dyskryminacja (łac. discrimino - rozróżniam) to rozróżnianie dwóch bodźców dźwiękowych o różnym natężeniu tej samej cechy np.:

    Ruchome obrazy są zazwyczaj mocno skompresowane, a więc dla kodeka MPEG, który używa podobnie jak JPEG transformaty kosinusowej, efekty blokowe mogą być bardzo uciążliwe.

    Podstrony: [1] 2 [3] [4]



    w oparciu o Wikipedię (licencja GFDL, CC-BY-SA 3.0, autorzy, historia, edycja)

    Warto wiedzieć że... beta

    Kompresja bezstratna (ang. lossless compression) – ogólna nazwa metod kompresji informacji do postaci zawierającej zmniejszoną liczbę bitów, pod warunkiem, że metoda ta gwarantuje możliwość odtworzenia informacji z postaci skompresowanej do identycznej postaci pierwotnej.
    Exchangeable Image File Format (Exif) - standard metadanych dla plików z obrazkami, wydany przez Japan Electronics and Information Technology Industries Association.
    Psychoakustyka – dziedzina nauki zajmująca się badaniem i opisywaniem związków zachodzących między falą dźwiękową docierającą do uszu słuchacza (bodźcem) a subiektywnie odczuwanym wrażeniem, które u niego wywołuje. Jest to nauka z pogranicza akustyki i psychologii. Działem akustyki zajmującym się psychoakustyką jest akustyka słuchu, natomiast działem psychologii jest psychologia poznawcza. Dziedzinami, do których stale odwołuje się psychoakustyka są również anatomia, neuropsychologia oraz fizjologia.
    RealAudio – format kompresji dźwięku stworzony przez firmę RealNetworks. Kodek został opracowany głównie z myślą o wykorzystaniu go w strumieniowaniu dźwięku przy łączu internetowym o niskiej przepustowości. Wiele internetowych stacji radiowych korzysta z RealAudio przy transmitowaniu audycji przez Internet.
    Kodek jest skrótem od "koder/dekoder", co oznacza urządzenie lub program zdolny do przekształcania strumienia danych lub sygnału. Kodeki mogą zmienić strumień danych w formę zakodowaną (często w celu transmisji, składowania lub zaszyfrowania) lub odzyskać (odkodować) strumień danych z formy zakodowanej, by umożliwić ich odtwarzanie bądź obróbkę. Kodeki są często używane w wideokonferencjach oraz strumieniowaniu obrazu lub dźwięku.
    Ogg - format kontenera strumieni danych, opracowany przez fundację Xiph.org, stworzony by wspierać inicjatywy związane z rozwojem wolnego oprogramowania do kodowania i dekodowania multimediów.
    Dyskretna transformacja kosinusowa, (DCT – ang. discrete cosine transform, czyli dyskretna transformacja cosinusowa) – jedna z najpopularniejszych blokowych transformacji danych. Jest szczególnie popularna w stratnej kompresji danych.

    Reklama

    Czas generowania strony: 0.831 sek.