• Artykuły
  • Forum
  • Ciekawostki
  • Encyklopedia
  • Kompresja stratna



    Podstrony: [1] [2] 3 [4]
    Przeczytaj także...
    Zmienna przepływność (ang. Variable Bit Rate, VBR) jest określeniem stosowanym w telekomunikacji oraz informatyce.Sygnał to abstrakcyjny model dowolnej mierzalnej wielkości zmieniającej się w czasie, generowanej przez zjawiska fizyczne lub systemy. Tak jak wszystkie zjawiska może być opisany za pomocą aparatu matematycznego, np. poprzez podanie pewnej funkcji zależnej od czasu. Mówimy, że sygnał niesie informację lub też umożliwia przepływ strumienia informacji.
    Kompresja dźwięku[ | edytuj kod]

    Dwa najpopularniejsze publicznie dostępne algorytmy – MP3 i Vorbis – używają podobnych technik. Warto tu omówić algorytm Vorbis, ponieważ używa on bardziej efektywnych rozwiązań.

  • Strumień jest dzielony na okna. Okna występują w dwóch rozmiarach – duże (zwykle 2048 próbek) i małe (zwykle 256 próbek). Małe służą do przedstawienia szybko zmieniającego się dźwięku oraz nagłego wzrostu intensywności dźwięku w danej częstotliwości. Nie używa się ich w przypadku spadków intensywności, ponieważ ludzkie ucho jest na nie znacznie mniej czułe. Okna nie są po prostu grupą kolejnych wartości natężenia dźwięku. Okna częściowo się nakrywają i jedna wartość należy w tych obszarach częściowo do kilku okien. Dla obszarów zachodzenia na siebie okien, dana wartość należy do lewego okna w stopniu sin(π/2 • sin(π/2 • t)), gdzie t=0 dla początku obszaru i t=1 dla jego końca.
  • Na każdym oknie jest przeprowadzana zmodyfikowana transformata kosinusowa. Zamiast poszczególnych wartości mamy teraz w bloku widmo parametrów MDCT, czyli (pomijając szczegóły) częstotliwości.
  • Dane z MDCT są upraszczane zależnie od parametrów kompresji, zgodnie z modelem psychoakustycznym.
  • Dane o energii, przypadającej na daną częstotliwość, są skalowane, co umożliwia równie dobrą kompresję dźwięków głośnych i cichych.
  • Dane są kwantyfikowane i kompresowane bezstratnie.
  • Zobacz też[ | edytuj kod]

  • kompresja bezstratna
  • kodek
  • formaty plików dźwiękowych
  • JPEG
  • DivX – stratna metoda kompresji obrazu filmowego, w nowszych wersjach zgodna z MPEG-4 część 2, pozwalającą zapisać na zwykłej płycie kompaktowej filmy o długości ok. 90 min i jakości niewiele ustępującej DVD-Video. Wykorzystywana także do przesyłania filmów przez Internet.Vorbis - stratny kodek dźwięku z rodziny Ogg. Bardzo często używany jest w połączeniu z kontenerem Ogg i nosi wtedy nazwę Ogg Vorbis (często błędnie zapisywaną tylko jako Ogg, czy nawet jako OGG). Ogg Vorbis potrafi obsłużyć do 255 kanałów i ponad 16-bitowy dźwięk w zakresie 6-48 kHz.


    Podstrony: [1] [2] 3 [4]



    w oparciu o Wikipedię (licencja GFDL, CC-BY-SA 3.0, autorzy, historia, edycja)

    Warto wiedzieć że... beta

    Kompresja danych (ang. data compression) – polega na zmianie sposobu zapisu informacji tak, aby zmniejszyć redundancję i tym samym objętość zbioru. Innymi słowy chodzi o wyrażenie tego samego zestawu informacji, lecz za pomocą mniejszej liczby bitów.
    Słuch – zmysł umożliwiający odbieranie (percepcję) fal dźwiękowych. Narządy słuchu nazywa się uszami. Słuch jest wykorzystywany przez organizmy żywe do komunikacji oraz rozpoznawania otoczenia.
    Podpróbkowanie chrominancji – metoda kodowania obrazów polegająca na zastosowaniu mniejszej rozdzielczości dla przetwarzania informacji o chrominancji (kolorze) niż dla informacji o luminancji (jasności). Korzysta ona z niedoskonałości ludzkiego wzroku, który ma znacznie mniejszą możliwość rozpoznawania różnic w kolorze niż w jasności na tym samym obrazie. Metoda ta jest używana w wielu algorytmach kompresji danych wideo (np. MPEG) i obrazów (np. JPG), zarówno analogowych jak i cyfrowych.
    MP3 ((ang.) MPEG-1/MPEG-2 Audio Layer 3) – algorytm kompresji stratnej dźwięku, przetworzonego uprzednio na sygnał cyfrowy. Popularnie zwany formatem MP3 lub standardem MP3. Jest zdefiniowany przez IETF w dokumencie RFC 5219.
    Zmodyfikowana dyskretna transformacja cosinusowa (MDCT, ang. Modified Discrete Cosine Transform) – blokowa transformacja danych oparta na przekształceniu kosinusowym typu DCT-IV, należąca do rodziny transformacji zakładkowych. Ta ostatnia cecha oznacza, że kolejne bloki próbek sygnału poddawane przekształceniu pobierane są nadmiarowo, z zakładką (część próbek jest wspólna), co pozwala wyeliminować tzw. efekt blokowy występujący przy zastosowaniu tej transformacji w kompresji sygnału.
    Model psychoakustyczny – model matematyczny, mówiący, jakie informacje o dźwięku są rozpoznawalne przez ludzkie ucho, jakie natomiast nie są. Modele psychoakustyczne są podstawą między innymi kompresji dźwięku, algorytmów oceny jakości transmisji mowy, systemów automatycznie rozpoznających mowę oraz rozpoznających mówców.
    Kompresja fraktalna to system kompresji stratnej opierający się na wykorzystaniu fraktali do reprezentacji danych. Używany jest prawie wyłącznie do kompresji obrazów. Najpopularniejszym zestawem fraktali są systemy funkcji iterowanych (IFS – Iterated Functions System).

    Reklama

    Czas generowania strony: 0.013 sek.