• Artykuły
  • Forum
  • Ciekawostki
  • Encyklopedia
  • Przetwarzanie języka naturalnego



    Podstrony: 1 [2] [3] [4] [5] [6]
    Przeczytaj także...
    Synteza mowy – dział przetwarzania mowy polegający na mechanicznej zamianie tekstu zapisanego w postaci znakowej na wypowiedź (mowę) w postaci dźwiękowej. Maszynę lub program komputerowy zamieniający tekst na mowę określa się mianem syntezatora mowy. W zależności od syntezatora, możemy uzyskać bardzo dokładną wymowę także słów nietypowych, literowanie różnych skrótów, odczytywanie liczb w tym również ułamków oraz odczytywanie dat poprzez dekomponowanie liczb. Syntezatory mowy mają wiele zastosowań. Pozwalają na zautomatyzowanie informowania bądź alarmowania użytkownika, są pomocne przy nauce języków obcych oraz tłumaczeniach, mogą także np. odczytywać dokumenty pisane alfabetem Brailla.Uczenie maszynowe albo uczenie się maszyn, systemy uczące się (ang. machine learning) – stosunkowo młoda i szybko rozwijająca się dziedzina wchodząca w skład nauk zajmujących się problematyką SI (patrz sztuczna inteligencja).

    Przetwarzanie języka naturalnego (ang. natural language processing, NLP) – interdyscyplinarna dziedzina, łącząca zagadnienia sztucznej inteligencji i językoznawstwa, zajmująca się automatyzacją analizy, rozumienia, tłumaczenia i generowania języka naturalnego przez komputer. System generujący język naturalny przekształca informacje zapisane w bazie danych komputera na język łatwy do odczytania i zrozumienia przez człowieka. Zaś system rozumiejący język naturalny przekształca próbki języka naturalnego na bardziej formalne symbole, łatwiejsze do przetworzenia dla programów komputerowych. Wiele problemów NLP wiąże się zarówno z generacją, jak i rozumieniem języka np. model morfologiczny zdania (struktura słów), który komputer powinien zbudować, jest potrzebny zarazem do tego by zdanie było zrozumiałe, jak i gramatycznie poprawne.

    Międzynarodowa Organizacja Normalizacyjna, ISO (ang. International Organization for Standardization, fr. Organisation internationale de normalisation) – organizacja pozarządowa zrzeszająca krajowe organizacje normalizacyjne.Statystyka (niem. Statistik, „badanie faktów i osób publicznych”, z łac. [now.] statisticus, „polityczny, dot. polityki”, od status, „państwo, stan”) – nauka, której przedmiotem zainteresowania są metody pozyskiwania i prezentacji, a przede wszystkim analizy danych opisujących zjawiska, w tym masowe.

    NLP pokrywa się również w znacznej mierze z działem lingwistyki komputerowej i często uważany jest za poddział sztucznej inteligencji. Natomiast termin język naturalny używany jest, by odróżnić języki ludzkie (takie jak hiszpański czy szwedzki) od języka formalnego czy komputerowego (jak C++, Java lub Lisp). Choć analiza języka naturalnego może zajmować się i tekstem, i mową, prace nad syntezą mowy rozwinęły się jako oddzielny dział.

    Anafora (także epanafora, gr. anaphorá "podniesienie") – lit. celowe powtórzenie tego samego słowa lub zwrotu na początku kolejnych segmentów wypowiedzi. Stosowana jest w poezji i oratorstwie.Analizator składniowy lub parser – program dokonujący analizy składniowej danych wejściowych w celu określenia ich struktury gramatycznej w związku z określoną gramatyką formalną. Nazwa analizator składniowy podkreśla analogię z analizą składniową stosowaną w gramatyce i językoznawstwie. Analizator składniowy umożliwia przetworzenie tekstu czytelnego dla człowieka w strukturę danych przydatną dla oprogramowania komputera.

    Spis treści

  • 1 Zadania i bariery
  • 2 Inne problemy
  • 3 Statystyczne NLP
  • 4 Główne zadania NLP
  • 5 Problemy
  • 6 Ocena NLP
  • 6.1 Cele
  • 6.2 Krótka historia oceny w NLP
  • 6.3 Różne rodzaje ocen
  • 6.4 Wspólne zadania (kampanie)
  • 7 Standaryzacja w NLP
  • 8 Czasopisma
  • 9 Organizacje i konferencje
  • 9.1 Stowarzyszenia
  • 9.2 Konferencje
  • 9.3 Organizacje
  • 10 Bibliografia
  • 10.1 Artykuły
  • 11 Linki zewnętrzne
  • Język szwedzki (szw. svenska språket, svenska) – język północnogermański wschodni (wschodnioskandynawski), używany głównie w Szwecji i częściach Finlandii, przez ok. 9 mln ludzi. W Finlandii język szwedzki jest, obok fińskiego, językiem urzędowym, z uwagi na 5% szwedzkojęzycznych obywateli Finlandii zamieszkałych głównie na wybrzeżach tego kraju. Szwedzki jest dość dobrze zrozumiały dla Norwegów i w mniejszym stopniu także dla Duńczyków. Język standardowy w Szwecji, tzw. rikssvenska (szwedzki państwowy) oparty jest na dialektach regionu sztokholmskiego.Definicja intuicyjna: Porównanie to zestawienie wskazujące na podobieństwo pod jakimś względem dwóch przedmiotów lub zjawisk przy użyciu słów typu jak (jakby, na podobieństwo...), np. "on jest (głupi) jak osioł".

    Zadania i bariery[]

    Analiza języka naturalnego jest, teoretycznie, bardzo atrakcyjną metodą porozumiewania się z komputerem. Jeden z pierwszych tego typu systemów SHRDLU, wzbudził ogromny entuzjazm naukowców, pracując zaskakująco dobrze na ograniczonych blokach słów i w obrębie ograniczonego języka. Entuzjazm szybko jednak wygasł, gdy system zderzył się z bardziej realnymi sytuacjami i prawdziwą złożonością oraz dwuznacznością słów.

    Część mowy – specyficzna dla danego języka, wyróżniona głównie na podstawie kryteriów składniowych i fleksyjnych klasa wyrazów (zobacz też klasyfikacja części mowy).Język japoński (jap. 日本語 nihongo lub nippongo) – język używany przez ok. 130 mln mieszkańców Japonii oraz japońskich emigrantów na wszystkich kontynentach.

    Sama definicja rozumienia jest dużym problemem analizy języka naturalnego. Wydaje się, że rozpoznanie języka naturalnego wymaga szerokiej wiedzy o świecie zewnętrznym i zdolności do przekształcania go. Z tego powodu rozumienie języka naturalnego nazywane jest często problemem AI-complete (problemem sztucznej inteligencji), który polega na tym, żeby dobrze rozumieć nasz świat i język, sztuczna inteligencja musiałaby postrzegać go tak samo jak my.

    Analiza składniowa (ang. parsing) – w informatyce i lingwistyce – proces analizy tekstu, w celu ustalenia jego struktury gramatycznej i zgodności z gramatyką języka. Słowo parsing pochodzi od (łac.) pars (ōrātiōnis), które oznacza część mowy.Język francuski (fr. langue française lub français) – język pochodzenia indoeuropejskiego z grupy języków romańskich. Jako językiem ojczystym posługuje się nim ok. 80 mln ludzi: ok. 65 mln Francuzów, ok. 4,5 mln Belgów (czyli 42%), ok. 1,5 mln Szwajcarów (czyli 20%), a także ok. 8 mln mieszkańców kanadyjskich prowincji Québec, Ontario i Nowy Brunszwik. Ok. 201 milionów osób na całym świecie używa francuskiego jako języka głównego (oszacowanie z 2009 r. według Organisation mondiale de la Francophonie), a 72 miliony jako drugiego języka codziennego (w tym krajach Maghrebu). Wiele z tych osób mieszka w krajach, w których francuski jest jednym z języków urzędowych, bądź powszechnie używanych (54 kraje). Paradoksalnie, w Algierii, Maroku, i Tunezji, gdzie nie ma statusu języka urzędowego, jest bardziej rozpowszechniony niż w wielu krajach Czarnej Afryki, w których jest jedynym językiem urzędowym.


    Podstrony: 1 [2] [3] [4] [5] [6]



    w oparciu o Wikipedię (licencja GFDL, CC-BY-SA 3.0, autorzy, historia, edycja)

    Warto wiedzieć że... beta

    Program komputerowy (ang. computer program) - sekwencja symboli opisująca obliczenia zgodnie z pewnymi regułami zwanymi językiem programowania. Program jest zazwyczaj wykonywany przez komputer (np. wyświetlenie strony internetowej), czasami bezpośrednio – jeśli wyrażony jest w języku zrozumiałym dla danej maszyny lub pośrednio – gdy jest interpretowany przez inny program (interpreter). Program może być ciągiem instrukcji opisujących modyfikacje stanu maszyny ale może również opisywać obliczenia w inny sposób (np. rachunek lambda).
    Proces Markowa – ciąg zdarzeń, w którym prawdopodobieństwo każdego zdarzenia zależy jedynie od wyniku poprzedniego. W ujęciu matematycznym, procesy Markowa to takie procesy stochastyczne, które spełniają własność Markowa.
    Akcent (od łac. accentus, zaśpiew), właśc. akcent wyrazowy – wyróżnienie za pomocą środków fonetycznych niektórych sylab w obrębie wyrazu.
    Język formalny – jest to podzbiór zbioru wszystkich słów nad skończonym alfabetem. Język formalny jest kluczowym pojęciem w informatyce, logice matematycznej i językoznawstwie. Język formalny nie jest uściśleniem pojęcia języka naturalnego i nie powinien być z nim mylony.
    Prawdopodobieństwo – ogólne określenie jednego z wielu pojęć służących modelowaniu doświadczenia losowego poprzez przypisanie poszczególnym zdarzeniom losowym liczb, zwykle z przedziału jednostkowego (w zastosowaniach często wyrażanych procentowo), wskazujących szanse ich zajścia. W rozumieniu potocznym wyraz „prawdopodobieństwo” odnosi się do oczekiwania względem rezultatu zdarzenia, którego wynik nie jest znany (niezależnie od tego, czy jest ono w jakimś sensie zdeterminowane, miało miejsce w przeszłości, czy dopiero się wydarzy); w ogólności należy je rozumieć jako pewną miarę nieprzewidywalności.
    Język hiszpański (hiszp. idioma español, castellano) – język należący do rodziny romańskiej języków indoeuropejskich. Współczesne standardy literackie (z Hiszpanii i Ameryki hiszpańskojęzycznej) wywodzą się ze średniowiecznego języka kastylijskiego. Jeszcze dziś język hiszpański bywa nazywany kastylijskim, dla odróżnienia go od innych języków używanych w Hiszpanii (zob. niżej).
    Tagowanie (ang. tagging – oznaczanie, zakładkowanie) – metoda oznaczania i umieszczania referencji do bloków danych. Pozwala to na odwoływanie się do nich według pewnej ich cechy – np. tagowanie poszczególnych części mowy w pliku tekstowym.

    Reklama