Model psychoakustyczny

Z Wikipedii, wolnej encyklopedii
Przejdź do nawigacji Przejdź do wyszukiwania

Model psychoakustyczny – model matematyczny, mówiący, jakie informacje o dźwięku są rozpoznawalne przez ludzkie ucho, jakie natomiast nie są. Modele psychoakustyczne są podstawą między innymi kompresji dźwięku, algorytmów oceny jakości transmisji mowy, systemów automatycznie rozpoznających mowę oraz rozpoznających mówców.

MP3 ((ang.) MPEG-1/MPEG-2 Audio Layer 3) – algorytm kompresji stratnej dźwięku, przetworzonego uprzednio na sygnał cyfrowy. Popularnie zwany formatem MP3 lub standardem MP3. Jest zdefiniowany przez IETF w dokumencie RFC 5219.Determinizm przyczynowy (łac. determinare — oddzielić, ograniczyć, określić) — koncepcja filozoficzna, według której wszystkie zdarzenia w ramach przyjętych paradygmatów są połączone związkiem przyczynowo-skutkowym, a zatem każde zdarzenie i stan jest zdeterminowane przez swoje uprzednio istniejące przyczyny (również zdarzenia i stany).

Modele psychoakustyczne są szczególną grupą modeli układu słuchowego. W tej grupie wytyczne do modelowania pochodzą z pomiarów psychoakustycznych (odsłuchowych), w których słuchacze oceniają wrażenia wywołane różnymi sygnałami testowymi, prezentowanymi w określonym kontekście (np. czy słyszą ton sinusoidalny prezentowany na tle szumu). Model przetwarza sygnał w taki sposób, aby jego wyjście stanowiło predykcję ocen subiektywnych słuchaczy. Zjawiskami słuchowymi, najczęściej wykorzystywanymi przy opracowywaniu modeli psychoakustycznych, są: maskowanie dźwięków, percepcja wysokości dźwięków oraz dyskryminacja modulacji amplitudy.

Dyskryminacja (łac. discrimino - rozróżniam) to rozróżnianie dwóch bodźców dźwiękowych o różnym natężeniu tej samej cechy np.:Częstotliwość (częstość) – wielkość fizyczna określająca liczbę cykli zjawiska okresowego występujących w jednostce czasu. W układzie SI jednostką częstotliwości jest herc (Hz). Częstotliwość 1 herca odpowiada występowaniu jednego zdarzenia (cyklu) w ciągu 1 sekundy. Najczęściej rozważa się częstotliwość w ruchu obrotowym, częstotliwość drgań, napięcia, fali.

Najprostszym faktem psychoakustycznym jest różna czułość ludzkiego ucha na dźwięki o różnych częstotliwościach (niektórych częstotliwości, np. bardzo wysokich lub bardzo niskich, nie słyszymy w ogóle). W odpowiednich warunkach odsłuchowych możliwe jest przeprowadzenie testu, pozwalającego na wyznaczenie charakterystyki czułości ucha ludzkiego na różne częstotliwości dźwięku oraz charakterystyk maskowania, które to elementy modelowania stanowią podstawę większości obecnych koderów, stosujących kompresję stratną. Należy zauważyć, że nawet stosowanie tak prostych elementów, jak miara decybelowa, może być traktowane jako zastosowanie modelu psychoakustycznego (patrz prawo Webera). Innym przykładem może być stosowanie w miernikach poziomu ciśnienia akustycznego krzywych korekcyjnych A, B i C, modelujących percepcję dźwięków, a będących przybliżeniem krzywych jednakowej głośności.

Prognozowanie (późnołac. prognosis, od starogr. πρόγνωσις, nowogr. πρόγνωση prōgnosis, od πρoγιγνώσκειν progignōskein, „wiedzieć wcześniej”, od pro- „wcześniej, przed” i gignōskein, „dowiedzieć się”) lub predykcja (łac. prædictus, im. od prædicere, „przepowiadać”, od præ-, „przed, wcześniej, pra-” i dicere, „mówić”) – naukowa metoda przewidywania tego, w jaki sposób będą kształtowały się w przyszłości procesy lub zdarzenia. W trakcie procesu prognozowania formułuje się sąd na temat przyszłych stanów zjawisk i zdarzeń nazywany prognozą.Psychoakustyka – dziedzina nauki zajmująca się badaniem i opisywaniem związków zachodzących między falą dźwiękową docierającą do uszu słuchacza (bodźcem) a subiektywnie odczuwanym wrażeniem, które u niego wywołuje. Jest to nauka z pogranicza akustyki i psychologii. Działem akustyki zajmującym się psychoakustyką jest akustyka słuchu, natomiast działem psychologii jest psychologia poznawcza. Dziedzinami, do których stale odwołuje się psychoakustyka są również anatomia, neuropsychologia oraz fizjologia.

Modele psychoakustyczne przewidują zwykle zakres słyszalności 20 Hz-20 kHz (dlatego właśnie większość współczesnych odtwarzaczy muzyki zapisanej cyfrowo ma takie pasmo przenoszenia) i maksymalną czułość w zakresie od 2 kHz do 4 kHz. Ponadto uwzględnia się maskowanie jednych dźwięków przez inne:

Ucho – narząd słuchu występujący jedynie u kręgowców. Najbardziej złożone i rozwinięte uszy występują u ssaków. Ucho odbiera fale dźwiękowe, przekształca je w drgania mechaniczne, a drgania w impulsy nerwowe. Odpowiada także za zmysł równowagi (błędnik).Kompresja stratna — metoda zmniejszania liczby bitów potrzebnych do wyrażenia danej informacji, które nie dają gwarancji, że odtworzona informacja będzie identyczna z oryginałem. Dla niektórych danych algorytm kompresji stratnej może odtworzyć informację w sposób identyczny.
 • maskowanie sąsiednich częstotliwości(maskowanie jednoczesne): ciche dźwięki o częstotliwościach zbliżonych do częstotliwości dźwięku głośnego nie są słyszalne;
 • maskowanie dźwięków następujących (maskowanie pobodźcowe): głośny dźwięk potrafi zagłuszyć cichsze dźwięki następujące zaraz po nim;
 • maskowanie dźwięków poprzedzających (maskowanie wsteczne): cichy dźwięk poprzedzający w krótkim czasie dźwięk głośny nie jest słyszalny – ta własność układu słuchowego jest szczególnie ciekawa, gdyż nie da się jej wyjaśnić na gruncie adaptacji krótkoterminowej układu słuchowego; równocześnie pokazuje ona, że układ słuchowy nosi pewne cechy układu nieprzyczynowego (problem nieprzyczynowości można rozwiązać, dopuszczając pewne opóźnienie w odbiorze bodźców dźwiękowych).
 • Zobacz też[ | edytuj kod]

 • MP3
 • Ogg Vorbis
 • maskowanie
 • model układu słuchowego
 • Ton lub ton prosty – dźwięk prosty, mający sinusoidalny przebieg o ściśle określonej częstotliwości, amplitudzie i fazie. Dźwięk taki można wytworzyć przy pomocy kamertonu lub generatora elektroakustycznego.Dźwięk – wrażenie słuchowe, spowodowane falą akustyczną rozchodzącą się w ośrodku sprężystym (ciele stałym, cieczy, gazie). Częstotliwości fal, które są słyszalne dla człowieka, zawarte są w paśmie między wartościami granicznymi od ok. 16 Hz do ok. 20 kHz.
  Warto wiedzieć że... beta

  Ogg - format kontenera strumieni danych, opracowany przez fundację Xiph.org, stworzony by wspierać inicjatywy związane z rozwojem wolnego oprogramowania do kodowania i dekodowania multimediów.
  Herc (Hz) – jednostka miary częstotliwości w układzie SI (jednostka pochodna układu SI) i w wielu innych, np. CGS, MKS i MKSA. Definiuje się ją jako liczbę cykli na sekundę.
  Modulacja – samorzutna lub celowa zmiana parametrów sygnału. Jeżeli modulowane są sygnały sinusoidalne, to proces ten może powodować zmiany amplitudy, częstotliwości lub fazy drgań. W przypadku fal prostokątnych (często stosowanych w technice cyfrowej) procesowi modulacji podlega szerokość, amplituda, pozycja (układ) oraz gęstość impulsów.
  Rozpoznawanie mowy – technologia pozwalająca komputerowi wyposażonemu w urządzenie do próbkowania dźwięku (np. karta dźwiękowa z mikrofonem) interpretować mowę ludzką, na przykład do celów transkrypcji lub jako alternatywną metodę interakcji z komputerem.
  Szum akustyczny – dźwięk, którego widmo jest w większości zakresu słyszalności zrównoważone, tzn. nie występują w tym widmie gwałtowne "piki" (maksima), które słyszalne mogłyby być jako dźwięczące rezonanse o określonej wysokości tonu. Przez analogię dla widma optycznego fali elektromagnetycznej, szum o całkowicie płaskim widmie sygnału akustycznego nazywa się szumem białym (światło białe to de facto szum elektromagnetyczny mieszaniny wszystkich możliwych barw o całkowicie płaskim widmie w zakresie widzialnym), natomiast szumy o widmie z przewagą częstotliwości niskich nazywa się szumem różowym (światło o przewadze niskich częstotliwości też jest różowe) lub niekiedy szumem /f. Szum o jeszcze większej przewadze częstotliwości niskich nazywa się szumem czerwonym (znowu przez analogię do światła, które nabiera barwy czerwonej, gdy ma jeszcze większą przewagę niskich częstotliwości).
  Model układu słuchowego – matematyczny lub numeryczny model, w maksymalnym stopniu naśladujący swym działaniem pracę rzeczywistego układu słuchowego.
  Maskowanie (psychoakustyka) – zjawisko zachodzące w układzie słuchowym polegające na podwyższeniu progu detekcji sygnału maskowanego w wyniku obecności innego sygnału – maskera. Rozróżnia się maskowanie równoczesne, gdy masker występuje razem z sygnałem maskowanym, oraz maskowanie nierównoczesne, gdy masker występuje bezpośrednio przed lub bezpośrednio po sygnale maskowanym. Zjawisko maskowania jest ściśle związane z adaptacją układu słuchowego. Wiedza na temat maskowania wykorzystywana jest między innymi w kodowaniu percepcyjnym.

  Reklama