Przesadne tłumaczenie maszynowe: „Bardzo łatwo pokonać Google po wyjęciu z pudełka”

Węzeł źródłowy: 824661

Każdego dnia przez nasze biuro przychodzą nowi ludzie, trochę się do tego przyzwyczailiśmy. Ale kiedy jeden z ojców tłumaczenia maszynowego wchodzi przez drzwi, jest to wystarczający powód, aby wyskoczyć ze skóry.

Tak się stało, gdy profesor Andy Way z Centrum ADAPT na Dublin City University dołączył do nas w Lizbonie podczas pierwszego odcinka Understand with Unbabel.

Profesor Andy Way zajmuje się tłumaczeniem maszynowym od 1988 roku i jest jednym z czołowych światowych badaczy w tej dziedzinie. Jednak, jak lubi podkreślać, mimo że nad tłumaczeniem maszynowym pracował wystarczająco długo, by nazywać go jednym z ojców, ludzie zajmowali się tłumaczeniem maszynowym na długo przed jego rozpoczęciem.


Początek tłumaczenia maszynowego i otaczający go sceptycyzm

Tłumaczenie maszynowe zyskało dużą popularność w ciągu ostatniej dekady, ale wierz lub nie, ludzie pracują nad tym od prawie 60 lat. W 1949 roku, według profesora Andy'ego:

„Był taki słynny list Warrena Weavera, w którym mówił o możliwości tłumaczenia maszynowego, że mogliśmy przyjrzeć się niektórym rzeczom, których nauczyliśmy się podczas wojny o kodowaniu, dekodowaniu i kodowaniu tajnych wiadomości i spróbować użyć tej samej technologii do przetwarzania ludzkich języków ”.

Wtedy wszystko się zaczęło.

Jednak początkowy entuzjazm nie trwał długo i został naturalnie zastąpiony sceptycyzmem, kiedy niesławny raport zasadniczo przewidywał, że nie będzie przyszłości dla tłumaczenia maszynowego z powodu problemu dwuznaczności, którego maszyny nigdy nie będą w stanie ujednoznacznić.

Słowa takie jak długopis, czy to przyrząd do pisania, czy też obudowa, w której trzymasz zwierzęta, byłyby dużym wyzwaniem, aby tłumaczenie maszynowe działało.

Pomimo sceptycyzmu, od tego czasu naukowcy byli w stanie odwrócić sytuację, a tłumaczenie maszynowe stało się jednym z największych trendów w technologii ostatnich dziesięcioleci, w szczególności neuronowego tłumaczenia maszynowego (NMT). Tak bardzo, że wydaje się, że jest to kolejna wielka rzecz, o której wszyscy mówią.


Tłumaczenie maszynowe neuronowe: czy usunie ludzi z równania?

„Neuronowe tłumaczenie maszynowe pojawiło się i wygląda na to, że wszystko wcześniej przeszło. Szybko staje się najnowocześniejszym rozwiązaniem ”.

Neuronowe tłumaczenie maszynowe jest jak system komputerowy działający jak mózg, po prostu naśladując biologiczne sieci neuronowe. Ten rodzaj systemu zasila się danymi w celu stopniowego uczenia się, a tym samym doskonalenia tłumaczenia.

To właściwie jest system, którego używamy i rozwijamy w Unbabel. Ale czy zastąpi ludzi w procesie tłumaczenia?

Pomimo wielkiego szaleństwa, zdaniem profesora Andy'ego „ten szum należy traktować z pewną ostrożnością”, ponieważ nie może on sam działać, aby zapewnić dokładne ludzkie tłumaczenie.

Obejrzyj poniższy wywiad:

Google powiedział nawet, że zbliżają się do jakości tłumaczeń wykonywanych przez ludzi w niedawnym artykule z 2016 roku. „Jak tylko to usłyszysz, tłumacze zaczynają trochę przestraszyć”, powiedział Andy, a „ostatnią rzeczą, jaką chcesz zrobić, jest zrazić tłumaczy ”. Czemu? Dlatego „Człowiek w pętli zawsze będzie najważniejszą częścią procesu tłumaczenia”.

Dlatego ludzie są kluczową częścią równania, a profesor Andy Way wyjaśnia nam, dlaczego:

„Jakość tłumaczenia maszynowego jest często bardzo, bardzo dobra, czasem myląco dobra. Tak więc, neuronowe tłumaczenie maszynowe może generować bardzo płynne wyniki, które nie mają nic wspólnego z rzeczywistym językiem źródłowym. Nie są to dobre tłumaczenia, ale mogą być bardzo trudne. Aby człowiek mógł wykryć, kiedy próbuje zweryfikować ostateczny dokument, zanim zostanie wysłany do klienta ”.

Aby neuronowe tłumaczenie maszynowe działało, „potrzebujemy ludzkich tłumaczeń, aby wprowadzić je do naszych systemów” i je szkolić. Gdy system otrzyma dane, zaczyna uczyć się wzorców i tworzyć lepsze tłumaczenia.

„Gdybyśmy przez chwilę pomyśleli, gdzie bylibyśmy bez tłumaczy, nie moglibyśmy nawet zacząć”, mówi Andy. Sekret polega na tym, aby „pozwolić maszynie robić to, w czym jest naprawdę dobra, a następnie pozwolić ludzkim elementom na dokonanie walidacji, poprawienie, zaktualizowanie danych źródłowych”.

A co z Google i jakością tłumaczenia wykonywanego przez ludzi? „Zawsze powtarzam swoim studentom, że Google nie jest firmą zajmującą się tłumaczeniami maszynowymi” - odpowiada Andy.

„Nigdy nie boję się przeciwstawić Google, jeśli rozmawiam z potencjalnymi klientami lub partnerami branżowymi, ponieważ w dobrze zdefiniowanym scenariuszu, w którym mamy dostosowane dane użytkownika, zawsze możemy wyszkolić silnik i uzyskać informacje zwrotne od ludzkich tłumaczy, aby spróbować ulepszyć silnik, a nie możesz tego zrobić z Google ”.

W praktyce, według profesora Andy Way'a, tak naprawdę „bardzo łatwe do pokonania po wyjęciu z pudełka Google".


Obejrzyj cały wywiad tutaj i Zapisz się do naszego newslettera aby otrzymać nadchodzący odcinek Understand with Unbabel, serialu, w którym zagłębiamy się w problemy, tematy i wyzwania, przed którymi stoimy, gdy przyspieszamy w kierunku świata bez barier językowych.

Źródło: https://unbabel.com/blog/overhyping-neural-machine-translation-easy-beat-box-google/

Znak czasu:

Więcej z Niebabel