• Artykuły
  • Forum
  • Ciekawostki
  • Encyklopedia
  • Ocena tłumaczenia maszynowego



    Podstrony: 1 [2] [3] [4]
    Przeczytaj także...
    BLEU (Bilingual Evaluation Understudy) jest algorytmem do ewaluacji jakości tłumaczenia automatycznego z jednego języka naturalnego na inny. Jakość jest rozumiana jako korelacja między danymi wyjściowymi a tekstem ludzkim: "im bliższe tłumaczenie automatyczne jest profesjonalnemu tłumaczeniu ludzkiemu, tym jest lepsze". BLEU był jedną z pierwszych metryk, która uzyskała wysoką korelację z ludzkim osądem jakości. Pozostaje także najbardziej popularną z metod.METEOR (Metric for Evaluation of Translation with Explicit ORdering) jest metryką używaną do ewaluacji tłumaczenia maszynowego. Metryka ta bazuje na średniej harmonicznej n-gramów precyzji i pokrycia, przy czym pokrycie ma większą wagę niż precyzja. METEOR zawiera także inne cechy, których nie znajdziemy w innych metrykach. Są to na przykład: dopasowanie synonimów (metryka dopasowuje nie tylko słowa będące dosłownym tłumaczeniem, ale również wyrazy bliskoznaczne). Przykładowo, jeśli słowo „dobry” występuje w tłumaczeniu referencyjnym a słowo „niezły” występuje w ocenianym tłumaczeniu, system ewaluujący policzy to jako dobre dopasowanie. Metryka zawiera również narzędzie, które odwołuje się do formy bazowej danego słowa i dopasowuje formy podstawowe. Metryka METEOR została zaprojektowana aby naprawić błędy pojawiające się w bardziej znanej i częściej używanej metryce BLEU oraz aby stworzyć korelację z ewaluacją dokonywaną przez człowieka na poziomie zdań i segmentów. Różnica pomiędzy metryką METEOR a BLEU polega na tym, że BLEU szuka korelacji na poziomie korpusu.

    Istnieją rozmaite metody oceny tłumaczenia maszynowego (ang. Machine Translation).

    Spis treści

  • 1 Tłumaczenie "tam i z powrotem" (ang. round-trip translation)
  • 2 Ocena przez człowieka
  • 2.1 Eksperyment przeprowadzony przez ALPAC (Automatic Language Processing Advisory Committee)
  • 2.2 Human Language Technologies Program prowadzony przez agencję ARPA
  • 3 Automatyczna ocena
  • 3.1 BLEU
  • 3.2 NIST
  • 3.3 WER
  • 3.4 METEOR
  • 4 Bibliografia
  • 5 Linki zewnętrzne
  • Lingwistyka komputerowa - dział lingwistyki używający modeli komputerowych w celu testowania hipotez dotyczących mowy i języka oraz tworzenia programów komputerowych przetwarzających język naturalny.Odległość Levenshteina (edycyjna) – miara odmienności napisów (skończonych ciągów znaków), zaproponowana w 1965 roku przez Władimira Lewensztejna.


    Podstrony: 1 [2] [3] [4]



    w oparciu o Wikipedię (licencja GFDL, CC-BY-SA 3.0, autorzy, historia, edycja)

    Warto wiedzieć że... beta

    Tłumaczenie automatyczne albo tłumaczenie maszynowe (ang. Machine Translation) jest dziedziną językoznawstwa komputerowego, które zajmuje się stosowaniem algorytmów tłumaczenia tekstu z jednego języka (naturalnego) na drugi.
    Korpus - zbiór tekstów służący badaniom lingwistycznym, np. określaniu częstości występowania form wyrazowych, konstrukcji składniowych, kontekstów w jakich pojawiają się dane wyrazy. Korpusy językowe znalazły szerokie zastosowanie we współczesnej leksykografii. Są też wykorzystywane jako zbiory danych uczących i testowych w metodach uczenia maszynowego stosowanych w przetwarzaniu języków naturalnych.
    N-gram - model językowy stosowany w rozpoznawaniu mowy . N-gramy opierają się na statystykach i służą do przewidywania kolejnego elementu sekwencji. Stosowane są głównie do słów, jak również na przykład do fonemów (a także do zastosowań niezwiązanych z lingwistyką, jak np. biologia obliczeniowa).

    Reklama