„Traducerea neurală” introdusă de Google e bună. Dar nu suficient de bună

Am testat noul Google Translate, în modul română-engleză, despre care oficialii companiei Alphabet Inc., care operează cel mai popular motor de căutare, susțin că este mult mai bun prin comparație cu vechiul program de traduceri.

Rezultatul confirmă doar parțial spusele reprezentanților Google, conform cărora, citez: „traducerea este mai precisa si mai usor de inteles. Acest lucru se explica prin noua tehnologie utilizata de Google Translate: «traducere neurala» (in original «neural translation»). (…) Traducerea neurala este mult mai buna decat vechiul sistem bazat pe traducerea de cuvinte disparate si bucati de text, intrucat acum sunt traduse frazele intregi. In spatele acestei tehnologii se afla un proces intens de dezvoltare de tip «machine learning», detaliat pe blogul Google dedicat cercetarii. Acest lucru genereaza traduceri care suna mult mai aproape de modul in care oamenii vorbesc, in special atunci cand sunt traduse fraze intregi”, am încheiat citatul.

În susținerea afirmației, reprezentanții Google România ne prezintă traducerea unui scurt fragment din „Maitreyi”, popularul roman al lui Mircea Eliade.

În schimb, eu am selectat, la întâmplare, un fragment dintr-o știre de azi, difuzată de News.ro.

Traducerea este, într-adevăr, surprinzător de bună. Dar, conține erori ciudate, care o fac inutilizabilă, de către un profan.

Astfel, deși Google Translate știe semnificația cuvântului „grațiere”, respectiv „pardon”, traducerea în text este complet aiurea. Odată apare că „Legea grațierii” ar fi „Parental Law” (Legea parentală); apoi, se spune că pedepsele sunt „majorate complet”, în loc de grațiate („are fully appreciated”).

„Traducerea neurală” se împiedică și atunci când are de rezolvat o formulă simplă, precum „pedeapsă de 3 până la 4 ani”, pentru care ni se oferă rezultatul „a 3-to-3 penalty At 4 years” (ininteligibil).

În concluzie, chiar dacă este un salt important de la vechiul Google Translate, traducerea neurală e un instrument utilizabil doar de către traducătorii avizați.

În continuare, câteva informații utile despre noul Google Translate, transmise de Grayling, compania de PR a Google (Alphabet Inc) în România:

Acest nou tip de traducere va functiona automat in toate locurile unde Google Translate este disponibil. In prezent este disponibil pe aplicatia de Android sau iOS, pe domeniul translate.google.ro si prin Google Search. In curand se va regasi si in solutia de traducere automata a paginilor din Chrome. Romana se alatura astfel celorlalte limbi care beneficiaza de tehnologia de traducere neurala. Obiectivul este ca, in cel mai scurt timp, toate cele 103 limbi acoperite de Google Translate sa treaca la noua tehnologie de traducere. O mentiune speciala trebuie facuta la adresa miilor de vorbitori de limba romana, membri ai comunitatii Google Translate, care au contribuit la dezvoltarea tehnologiei de traduceri neurale.

Pe scurt:

  • Traducerea neurala functioneaza doar in pereche cu limba engleza;
  • Pe langa aplicatia de mobil si desktop, noua tehnologie este disponibila si pentru extensiile de Chrome si Android Wear. Urmeaza a fi disponibila si pe alte platforme, precum traducerile automate de pagini web in Chrome, Google Assistant si Sheets/Docs;
  • Tehnologia de traducere neurala nu functioneaza in modul Word Lens sau Offline din Google Translate;
  • Modul de conversatie din Google Translate in limba romana beneficiaza de traducere neurala;
  • Traducerea neurala in si din engleza, disponibila in prezent pentru 32 de limbi, acopera limba materna a jumatate din populatia lumii. Obiectivul este ca toate cele 103 limbi din Google Translate sa beneficieze de aceasta tehnologie.

Pentru cei interesati de detalii tehnice privind traducerea neurala:

Tehnologia se bazeaza pe o inovatie intalnita in multe sisteme neurale, denumita „atentie” („attention”, in engleza). Pe masura ce analizeaza bucata cu bucata intreaga fraza, sistemul consulta din nou parti din fraza sursa pentru a gasi solutii mai bune de continuare. Sistemul anterior utilizat pentru traducere nu putea analiza atatea bucati de continut in acelasi timp. Aceasta imbunatatire este perceptibila in mai multe cazuri:

  • Variabile gramaticale precum gen si numar sunt solutionate de cele mai multe ori corect;
  • Vocabularul in fraza este consecvent. Daca un cuvant cu mai multe sensuri apare de doua ori intr-o fraza, in general va fi tradus in acelasi fel in ambele situatii;
  • Sensul dintr-o parte a frazei poate influenta variantele de traducere din alta parte a ei. De exemplu, verbul „a lua” poate fi tradus diferit, in functie de situatie: „a lua” ca posesie sau „a lua si duce” intr-un loc. In functie de sens, este posibil ca Google Translate sa stabileasca traducerea potrivita. In cazul tehnologiei anterioare, sensul era pierdut, deoarece traducerea era realizata dupa ce fraza era „sparta” in bucati.

510 total views, 2 views today

Comments

comments