• Artykuły
  • Forum
  • Ciekawostki
  • Encyklopedia
  • Rozpoznawanie mowy



    Podstrony: [1] [2] [3] [4] 5 [6]
    Przeczytaj także...
    Mariusz Ziółko (ur. 18 września 1946 w Hamburgu) – polski automatyk, matematyk i elektronik, profesor nauk technicznych.Polska Platforma Bezpieczeństwa Wewnętrznego, PPBW – naukowa sieć, powstała w 2005 roku, jako jedna z nadzorowanych przez Radę Ministrów, a zainicjowanych przez Komisję Europejską platform technologicznych, której zadania polegają na tworzeniu zaawansowanych, zintegrowanych narzędzi technologicznych i informatycznych, wspomagających działania organów ścigania i wymiaru sprawiedliwości na rzecz bezpieczeństwa publicznego.
    Zobacz też[]
  • Watson (superkomputer)
  • Fonologia
  • Fonetyka
  • Fonoskopia
  • Przypisy

    1. Tomasz Grynkiewicz. Komputer pojął Gierka, a z Kaczyńskim miał problem. „Gazeta Wyborcza”. Nauka, s. 22, 2008-12-08. Agora SA (pol.). 
    2. Bartosz Ziółko, Mariusz Ziółko: Przetwarzanie mowy. Kraków: Wydawnictwa AGH, 2011. ISBN 978-83-7464-441-9. (pol.)
    3. Stephen Cook: Speech Recognition HOWTO (ang.). Linuxdoc.org, 2002-04-19. [dostęp 2016-05-14].
    4. Krzysztof Marasek: Od rozpoznawania do tłumaczenia mowy polskiej (pol.). PJWSTK, 2012-09-26. [dostęp 2014-02-19].
    5. M.A. Sapożkow: Sygnał mowy w telekomunikacji i cybernetyce. Warszawa: WNT, 1966. (pol.)
    6. IBM Shoebox (ang.). IBM. [dostęp 2014-02-19].
    7. J. Baker. The DRAGON system – An overview. „IEEE Transactions on Acoustics, Speech and Signal Processing”. 23 (1), s. 24-29, luty 1975. DOI: 10.1109/TASSP.1975.1162650. ISSN 0096-3518 (ang.). 
    8. Garfinkel, 1998, History of Speech Recognition and Transcription Software.
    9. Melanie Pinola: Speech Recognition Through the Decades: How We Ended Up With Siri (ang.). International Data Group Inc., 2011-11-03. [dostęp 2014-02-19].
    10. Jonathan Strickland: Expert Stuff: Google’s Mike Cohen (ang.). HowStuffWorks, Inc, 2011-03-16. [dostęp 2014-02-19].
    11. J. M. Baker, L. Deng, J. Glass, S. Khudanpur, Chin-Hui Lee, N. Morgan, and D. O’Shaughnessy „Research Developments and Directions in Speech Recognition and Understanding” IEEE SPM maj 2009.
    12. M. Forsberg, „Why is speech recognition difficult?” Chalmers University of Technology, 2003, s. 9 i poprzednie.
    13. B. Shneiderman, „The limits of speech recognition” Communications of the ACM, t. 43, nr 9, s. 63–65, wrzesień 2000.
    14. Speech Recognition Lectures, Mehryar Mohri, 2012.
    15. CMU Sphinx, 2011-09-23 Russian Audiobook Morphology-Based Model.
    16. Basic concepts of speech (ang.). CMU Sphinx, 2010. [dostęp 2014-03-11].
    17. John R. Hershey et al. „Super-human multi-talker speech recognition: A graphical modeling approach” styczeń 2010.
    18. CHANDRA, DHRUBA „Speech Recognition Co-Processor” strona 3 (16)., North Carolina 2007.
    19. CMU Sphinx na SourceForge.Net, 23-12-2012.
    20. B. Harb et al. Back-off Language Model Compression. 2009.
    21. Stephen Cook, Speech Recognition HOWTO (ang.), Linuxdoc.org, 2002-04-19.
    22. L. R. Rabiner, B. H. Juang, An Introduction to Hidden Markov Models, w: 1986 IEEE ASSP Magazine, styczeń 1986, s. 13.
    23. Jak niektóre zastosowania Ukrytych Modeli Markowa np. do analizy manuskryptu Voynicha, źródło: René Zandbergen, Voynich Manuscript analysis.
    24. M. E. D’Imperio, 1979, An Application of PTAH to the Voynich Manuscript, National Security Agency Technical Journal.
    25. R. Kuhn, R. De Mori, czerwiec 1990. „A Cache-Based Natural Language Model for Speech Recognition”. IEEE TPAMI.
    26. VoxForge.
    27. (ang.) Google Chrome: How to Use the Web Speech API, maj 2013.
    28. Chip Mulligan: Nuance brings voice recognition to mobile phones (ang.). W: The Inquirer [on-line]. Incisive Media, 2007-02-07. [dostęp 2014-02-22].
    29. Web Speech API Specification 19 października 2012.
    30. Google Is All About Large Amounts of Data, 2007-12-16, googlesystem.blogspot.com.
    31. Juan Carlos Perez, 2007-10-23, Google wants your phonemes.
    32. C. Chalba et al., 2012, Language Modeling for Automatic Speech Recognition Meets the Web: Google Search by Voice.
    33. C. Wilt, J. Thayer, W. Ruml, 2010, „A Comparison of Greedy Search Algorithms”, AAAI.
    34. J.R. Pierce, 1969, Whither Speech Recognition? za: Talks to Teachers on psychology... s.159 William James 1899.
    35. www.smartertravel: Five Translation Apps Put to the Test, 01-06-2013.
    36. Oficjalna strona JCP (JSR #113 JavaTM Speech API 2.0 Final Approval Ballot), 5 maja 2008.
    37. Laboratorium Technologii Języka i Mowy.
    38. www.ppbw.pl: Projekty badawcze.
    39. Koncepcja PBW (...) w ramach projektu „Nowoczesne metody naukowego wsparcia zarządzania bezpieczeństwem publicznym w Unii Europejskiej”, Poznań, 2005.
    40. Arkadiusz Wolski: Rozpoznawanie mowy – monitoring TV i radia (pol.). New Europe Events Sp. z o.o., 2006-10-26. [dostęp 2014-02-22]. [zarchiwizowane z tego adresu (2012-07-20)].
    41. SkryBot doMowy rozpoznawanie mowy polskiej.
    42. Polskie Centrum Technologii Rozpoznawania Mowy.
    43. Rozpoznawanie mowy przez internet, tworzenie i wyszukiwanie napisów.
    44. MagicScribe – Rozpoznawanie mowy i zamiana na tekst (pol.). Unikkon Integral Sp. z o.o.. [dostęp 2014-11-17].
    45. System Rozpoznawania i Zamiany Mowy na Tekst – MagicScribeMedical (pol.). Unikkon Integral Sp. z o.o.. [dostęp 2014-11-17]. [zarchiwizowane z tego adresu (2011-10-04)].
    46. System Rozpoznawania i Zamiany Mowy na Tekst – MagicScribeLegal (pol.). Unikkon Integral Sp. z o.o.. [dostęp 2014-11-17]. [zarchiwizowane z tego adresu (2012-04-04)].
    47. Zespół Przetwarzania Sygnałów AGH.
    48. Strona spikit.pl.
    49. support.google.com Pisanie za pomocą rozpoznawania mowy (beta).
    50. wiki.openmoko.org: Google Voice Recognition.
    51. www.linux.com: Inside Palaver: Linux Speech Recognition that Taps Google’s Voice Technology 28-03-2013.
    52. Maciej Kluk, Google Voice Search od dziś w języku polskim, www.pcworld.pl, 15-09-2010.
    53. Sebastian Brzuzek, Dragon Dictation i Dragon Search ze wsparciem języka polskiego, 03-10-2011.
    54. Tomasz Grynkiewicz, „Polak i komputer, dwa bratanki”, Gazeta Wyborcza, 19-08-2010.
    55. Strona SpeechStorm.
    56. Strona Nuance Dragon Naturally Speaking.
    57. Strona SkryBot doMowy.
    58. Strona Nuance Call Steering.

    Linki zewnętrzne[]

  • Technologia mowy (materiały dydaktyczne AGH)
  • Blog Rozpoznawanie Mowy
  • Algorytm zachłanny (ang. greedy algorithm) – algorytm, który w celu wyznaczenia rozwiązania w każdym kroku dokonuje zachłannego, tj. najlepiej rokującego w danym momencie wyboru rozwiązania częściowego. Innymi słowy algorytm zachłanny nie dokonuje oceny czy w kolejnych krokach jest sens wykonywać dane działanie, dokonuje decyzji lokalnie optymalnej, dokonuje on wyboru wydającego się w danej chwili najlepszym, kontynuując rozwiązanie podproblemu wynikającego z podjętej decyzji. Typowe zadanie rozwiązywane metodą zachłanną ma charakter optymalizacyjny. W dziedzinie sztucznej inteligencji zachłanna odmiana przeszukiwania lokalnego jest nazywana "podchodzeniem pod wzgórze".Uczenie maszynowe albo uczenie się maszyn, systemy uczące się (ang. machine learning) – stosunkowo młoda i szybko rozwijająca się dziedzina wchodząca w skład nauk zajmujących się problematyką SI (patrz sztuczna inteligencja).


    Podstrony: [1] [2] [3] [4] 5 [6]



    w oparciu o Wikipedię (licencja GFDL, CC-BY-SA 3.0, autorzy, historia, edycja)

    Warto wiedzieć że... beta

    Agora Spółka Akcyjna – polska, publiczna spółka prawa handlowego, notowana na giełdzie w Warszawie, prowadząca działalność mediową. Nazwa spółki pochodzi od greckiego określenia miejsca spotkań.
    Akademia Górniczo-Hutnicza im. Stanisława Staszica w Krakowie (AGH; dawniej: Akademia Górnicza w Krakowie; nazwa międzynarodowa: AGH University of Science and Technology; dawniej: University of Mining and Metallurgy) – jedna z największych polskich wyższych uczelni, została powołana 8 kwietnia 1919 uchwałą Rady Ministrów. Jest zaliczana do najlepszych uczelni technicznych w kraju. Według ogólnoświatowego rankingu szkół wyższych Webometrics Ranking of World Universities z lipca 2013, opracowanego przez hiszpański instytut Consejo Superior de Investigaciones Científicas uczelnia zajmuje 3. miejsce w Polsce wśród uczelni technicznych, a na świecie 526. pośród wszystkich typów uczelni.
    Nuance Communications jest amerykańską, międzynarodową korporacją działająca w dziedzinie technologii oprogramowania komputerowego, z siedzibą w Burlington, w stanie Massachusetts, USA, dostarczają aplikacje rozumienia mowy i obrazowania. Aktualnie oferta firmy koncentruje się na serwerach i platformach rozpoznawania mowy, systemach zarządzania głosem, biometrii głosowej, automatycznych telefonicznych usługach katalogowych, oprogramowaniu i systemach językowej transkrypcji dla służby zdrowia, oprogramowaniu do optycznego rozpoznawania znaków i oprogramowaniu do przetwarzania obrazu na pulpicie. Spółka posiada również mały oddział odpowiedzialny za oprogramowanie i rozwój systemów dla agencji wojskowych i rządowych. W październiku 2011 r. , niepotwierdzone źródła wskazywały, że jej serwery obsługują aplikacje iPhone 4S Siri rozpoznawania mowy. [ 3 ]
    VoiceXML (VXML) – aplikacja języka XML służąca do opisu interaktywnych dialogów pomiędzy człowiekiem i komputerem. Jest ona w pełni analogiczna do HTML i przynosi podobne korzyści w pisaniu aplikacji głosowych, jakie HTML niesie dla aplikacji wizualnych. Dokumenty VoiceXML są interpretowane przez przeglądarki głosowe, analogicznie jak dokumenty HTML, które interpretowane są przez przeglądarki internetowe. Najczęstszym rozwiązaniem jest podłączenie szeregu przeglądarek głosowych do sieci telefonicznej (PSTN), dzięki czemu użytkownicy mogą po prostu zadzwonić i rozpocząć interakcję z aplikacją głosową.
    IVR (ang. Interactive Voice Response) to nazwa systemu w telekomunikacji, umożliwiającego interaktywną obsługę osoby dzwoniącej.
    Komputer (z ang. computer od łac. computare – liczyć, sumować; dawne nazwy używane w Polsce: mózg elektronowy, elektroniczna maszyna cyfrowa, maszyna matematyczna) – maszyna elektroniczna przeznaczona do przetwarzania informacji, które da się zapisać w formie ciągu cyfr albo sygnału ciągłego.
    Apercepcja – termin filozoficzny oznaczający postrzeganie samego siebie, świadomość samego siebie, postrzeganie przez umysł jego własnych stanów.

    Reklama

    Czas generowania strony: 0.057 sek.