Yandex začal používať neurónové siete v Translator na zlepšenie prekladu. Prečo sa prekladatelia nemusia báť neurónových sietí Google Vplyv neurónových sietí na vývoj strojového prekladu

alebo Z kvantity sa vyvinie kvalita?

Článok na základe prejavu na konferencii RIF+KIB 2017.

Neurónový strojový preklad: prečo až teraz?

O neurónových sieťach sa hovorí už dlho a zdalo by sa, že jeden z klasických problémov umelej inteligencie – strojový preklad – si jednoducho žiada riešiť práve na základe tejto technológie.

Napriek tomu je tu dynamika popularity pri vyhľadávaní dopytov o neurónových sieťach vo všeobecnosti a najmä o neurónovom strojovom preklade:

Je jasne viditeľné, že donedávna nebolo nič na radare o neurónovom strojovom preklade – a teraz, koncom roka 2016, nové technológie a systémy strojového prekladu postavené na neurálne siete, ktorú predviedli viaceré spoločnosti vrátane Google, Microsoft a SYSTRAN. Objavili sa takmer súčasne, niekoľko týždňov alebo dokonca dní od seba. prečo je to tak?

Na zodpovedanie tejto otázky je potrebné pochopiť, čo je strojový preklad založený na neurónových sieťach a aký je jeho kľúčový rozdiel od klasických štatistických systémov alebo analytických systémov, ktoré sa dnes používajú na strojový preklad.

Neurónový prekladač je založený na mechanizme obojsmerných rekurentných neurónových sietí (Bidirectional Recurrent Neural Networks), postavených na maticových výpočtoch, čo umožňuje zostaviť podstatne zložitejšie pravdepodobnostné modely ako štatistické strojové prekladače.


Podobne ako štatistický preklad, aj neurálny preklad si vyžaduje na trénovanie paralelné korpusy, ktoré umožňujú porovnávať automatický preklad s referenčným „ľudským“ len v procese učenia sa nepracuje s jednotlivými frázami a slovnými spojeniami, ale s celými vetami. Hlavným problémom je, že trénovanie takéhoto systému vyžaduje podstatne väčší výpočtový výkon.

Na urýchlenie procesu vývojári používajú GPU od NVIDIA a Google tiež používa Tensor Processing Unit (TPU) – proprietárne čipy prispôsobené špeciálne pre technológiu. strojové učenie. Grafické čipy sú spočiatku optimalizované pre algoritmy výpočtu matice, a preto je nárast výkonu 7-15-násobný v porovnaní s CPU.

Napriek tomu tréning jedného neurónového modelu trvá 1 až 3 týždne, zatiaľ čo štatistický model približne rovnakej veľkosti trvá 1 až 3 dni a tento rozdiel sa zvyšuje so zvyšujúcou sa veľkosťou.

Neboli to však len technologické problémy, ktoré bránili rozvoju neurónových sietí v kontexte úlohy strojového prekladu. Jazykové modely sa nakoniec podarilo trénovať aj skôr, aj keď pomalšie, ale zásadné prekážky nenastali.

Svoju úlohu zohrala aj móda pre neurónové siete. Mnoho ľudí sa vnútorne vyvíjalo, ale neponáhľali sa to oznámiť, možno sa obávali, že sa nedočkajú zvýšenia kvality, ktorú spoločnosť od slovného spojenia Neurónové siete očakáva. To môže vysvetliť skutočnosť, že niekoľko nervových prekladateľov bolo oznámených jeden po druhom.

Kvalita prekladu: koho skóre BLEU je hrubšie?

Skúsme pochopiť, či zvýšenie kvality prekladu zodpovedá nahromadeným očakávaniam a nárastu nákladov, ktoré sprevádzajú vývoj a podporu neurónových sietí pre preklad.
Google vo svojom výskume demonštruje, že neurónový strojový preklad poskytuje relatívne zlepšenie od 58 % do 87 % v závislosti od jazykového páru v porovnaní s klasickým štatistickým prístupom (alebo frázovým strojovým prekladom, PBMT, ako sa tiež nazýva).


SYSTRAN vykonáva štúdiu, v ktorej sa kvalita prekladu hodnotí výberom z niekoľkých prezentovaných možností rôznych systémov, ako aj „ľudského“ prekladu. A uvádza, že jeho nervový preklad je uprednostňovaný v 46% prípadov pred ľudským prekladom.

Kvalita prekladu: existuje nejaký prelom?

Aj keď Google uvádza zlepšenie o 60% alebo viac, toto číslo má malý háčik. Zástupcovia spoločnosti hovoria o „relatívnom zlepšení“, teda o tom, ako blízko sa im podarilo s nervovým prístupom ku kvalite Human Translation vo vzťahu k tomu, čo bolo v klasickom štatistickom prekladači.


Odborníci z odvetvia analyzujúci výsledky prezentované spoločnosťou Google v článku „Google's Neural Machine Translation System: Bridging the Gap between Human and Machine Translation“ sú k prezentovaným výsledkom dosť skeptickí a tvrdia, že v skutočnosti sa skóre BLEU zlepšilo len o 10 % a Významný pokrok je viditeľný práve na pomerne jednoduchých testoch z Wikipédie, ktoré sa s najväčšou pravdepodobnosťou použili v procese trénovania siete.

Vo vnútri PROMT pravidelne porovnávame preklady rôznych textov našich systémov s konkurenciou, a preto máme vždy po ruke príklady, na ktorých si overíme, či je neurónový preklad skutočne taký lepší ako predchádzajúca generácia, ako tvrdia výrobcovia.

Pôvodný text (EN): Worrying never done ktokoľvek akýkoľvek dobre.
Google Translation PBMT: Neurobil nikomu nič dobré bez obáv.
Google Translation NMT: Obavy nikdy nikomu nepomohli.

Mimochodom, preklad tej istej frázy na Translate.Ru: „Starosť nikdy nikomu nepriniesla výhody,“ môžete vidieť, že to bolo a zostáva rovnaké bez použitia neurónových sietí.

Microsoft Translator tiež v tejto veci nezaostáva. Na rozdiel od svojich kolegov z Google dokonca vytvorili webovú stránku, kde si môžete preložiť a porovnať dva výsledky: neurónový a predneurálny, aby ste sa uistili, že vyhlásenia o raste kvality nie sú neopodstatnené.


Na tomto príklade vidíme, že pokrok nastal a je skutočne badateľný. Na prvý pohľad sa zdá, že tvrdenie vývojárov, že strojový preklad takmer dobehol ľudský preklad, je pravdivé. Je to však naozaj tak a čo to znamená z hľadiska praktickej aplikácie technológií pre podnikanie?

Vo všeobecnosti je preklad pomocou neurónových sietí lepší ako štatistický preklad a táto technológia má obrovský potenciál rozvoja. Ak sa však na problém pozrieme pozorne, vidíme, že pokrok nie je vo všetkom a nie všetky úlohy sa dajú aplikovať na neurónové siete bez ohľadu na úlohu samotnú.

Strojový preklad: aké sú výzvy?

Od automatického prekladača celá história jeho existencie - a to je už viac ako 60 rokov! – očakávali nejakú mágiu, predstavovali si to ako stroj zo sci-fi filmov, ktorý okamžite premení akúkoľvek reč na mimozemskú píšťalku a späť.

V skutočnosti existujú úlohy rôzne úrovne, z ktorých jeden znamená „univerzálny“ alebo, takpovediac, „každodenný“ preklad pre každodenné úlohy a ľahké porozumenie. Online prekladateľské služby a mnohé mobilné produkty dobre zvládajú úlohy na tejto úrovni.

Takéto úlohy zahŕňajú:

Rýchly preklad slov a krátkych textov na rôzne účely;
automatický preklad počas komunikácie na fórach, in v sociálnych sieťach, poslovia;
automatický preklad pri čítaní správ, článkov na Wikipédii;
prekladač na cestách (mobil).

Všetky tie príklady zvyšovania kvality prekladu pomocou neurónových sietí, o ktorých sme hovorili vyššie, sa týkajú práve týchto úloh.

Pokiaľ však ide o obchodné ciele a ciele týkajúce sa strojového prekladu, veci sú trochu iné. Tu sú napríklad niektoré požiadavky na podnikové systémy strojového prekladu:

Preklady obchodnej korešpondencie s klientmi, partnermi, investormi, zahraničnými zamestnancami;
lokalizácia webových stránok, internetových obchodov, popisov produktov, návodov;
preklad používateľského obsahu (recenzie, fóra, blogy);
schopnosť integrovať preklad do podnikových procesov a softvérové ​​produkty a služieb;
presnosť prekladu v súlade s terminológiou, dôvernosť a bezpečnosť.

Pokúsme sa na príkladoch pochopiť, či je možné nejaké obchodné problémy s prekladom vyriešiť pomocou neurónových sietí a ako presne.

Prípad: Amadeus

Amadeus je jedným z najväčších svetových distribučných systémov leteniek. Na jednej strane sú na ňu napojení leteckí dopravcovia, na druhej agentúry, ktoré musia všetky informácie o zmenách dostávať v reálnom čase a sprostredkovať ich svojim klientom.

Úlohou je lokalizovať podmienky uplatňovania taríf (Tarifné pravidlá), ktoré sa automaticky generujú v rezervačnom systéme z rôznych zdrojov. Tieto pravidlá sa tvoria vždy na anglický jazyk. Ručný preklad je tu prakticky nemožný, vzhľadom na to, že informácií je veľa a často sa menia. Letecký agent by si rád prečítal tarifné pravidlá v ruštine, aby mohol rýchlo a kompetentne poradiť svojim klientom.

Vyžaduje sa jasný preklad, ktorý vyjadruje význam tarifných pravidiel, berúc do úvahy typické výrazy a skratky. A vyžaduje, aby bol automatický preklad integrovaný priamo do rezervačného systému Amadeus.

→ Úloha a realizácia projektu sú podrobne popísané v dokumente.

Skúsme porovnať preklad vytvorený prostredníctvom PROMT Cloud API integrovaného do Amadeus Fare Rules Translator a „neurálny“ preklad od Google.

Originál: OKAMŽITÉ NÁKUPNÉ CENY SPOLOČNEJ CESTY

PROMT (Analytický prístup): CENY ZA OKAMŽITÝ NÁKUP ZA OKRUHOVÉHO LETU

GNMT: KRUHOVÉ NÁKUPY

Je zrejmé, že tu si neurónový prekladač neporadí a o kúsok ďalej sa ukáže prečo.

Prípad: TripAdvisor

TripAdvisor je jednou z najväčších cestovných služieb na svete, ktorú netreba predstavovať. Podľa článku publikovaného The Telegraph sa na stránke denne objaví 165 600 nových recenzií rôznych turistických lokalít na stránke. rôzne jazyky.

Úlohou je preložiť turistické recenzie z angličtiny do ruštiny s kvalitou prekladu dostatočnou na pochopenie významu tejto recenzie. Hlavný problém: typické vlastnosti obsahu vytváraného používateľom (texty s chybami, preklepy, chýbajúce slová).

Súčasťou úlohy bolo aj automatické posúdenie kvality prekladu pred zverejnením na webe TripAdvisor. Keďže manuálne posúdenie všetkého preloženého obsahu nie je možné, riešenie strojového prekladu musí poskytovať automatický mechanizmus na hodnotenie kvality preložených textov – skóre spoľahlivosti – aby TripAdvisor mohol publikovať iba preložené recenzie. Vysoká kvalita.

Na riešenie bola použitá technológia PROMT DeepHybrid, ktorá umožňuje získať kvalitnejší preklad zrozumiteľný pre koncového čitateľa, a to aj prostredníctvom štatistickej post-editácie výsledkov prekladu.

Pozrime sa na príklady:

Originál: Jedli sme tam včera večer z rozmaru a bolo to krásne jedlo. Služba bola pozorná bez toho, aby bola prehnaná.

PROMT (hybridný preklad): Včera večer sme tam jedli z rozmaru a bolo to úžasné jedlo. Zamestnanci boli pozorní bez toho, aby boli arogantní.

GNMT: Jedli sme tam včera večer z rozmaru a bolo to úžasné jedlo. Služba bola pozorná bez toho, aby bola arogantná.

Tu všetko nie je z hľadiska kvality také deprimujúce ako v predchádzajúcom príklade. A vôbec, z hľadiska jeho parametrov je tento problém potenciálne riešiteľný pomocou neurónových sietí a to môže ešte zlepšiť kvalitu prekladu.

Výzvy používania NMT pre podnikanie

Ako už bolo spomenuté, „univerzálny“ prekladateľ nie vždy poskytuje prijateľnú kvalitu a nemôže podporovať špecifickú terminológiu. Ak chcete integrovať a používať neurónové siete na preklad do vašich procesov, musíte splniť základné požiadavky:

Prítomnosť dostatočného množstva paralelných textov, aby bolo možné trénovať neurónovú sieť. Často ich má zákazník jednoducho málo alebo v prírode neexistujú žiadne texty na túto tému. Môžu byť klasifikované alebo v stave, ktorý nie je príliš vhodný na automatické spracovanie.

Na vytvorenie modelu potrebujete databázu, ktorá obsahuje aspoň 100 miliónov tokenov (použitých slov) a na získanie prekladu viac či menej prijateľnej kvality - 500 miliónov tokenov. Nie každá firma má taký objem materiálov.

Dostupnosť mechanizmu alebo algoritmov na automatické hodnotenie kvality získaného výsledku.

Dostatočný výpočtový výkon.
„Univerzálny“ neurónový prekladač väčšinou kvalitou nevyhovuje a na nasadenie vlastnej súkromnej neurónovej siete schopnej poskytnúť prijateľnú kvalitu a rýchlosť práce je potrebný „malý cloud“.

Nie je jasné, čo robiť so súkromím.
Nie každý zákazník je pripravený poskytnúť svoj obsah na preklad do cloudu z bezpečnostných dôvodov a NMT je príbeh na prvom mieste v cloude.

závery

Neurónový automatický preklad vo všeobecnosti poskytuje výsledky vyššej kvality ako „čisto“ štatistický prístup;
Automatický preklad cez neurónovú sieť je vhodnejší na riešenie problému „univerzálneho prekladu“;
Žiadny z prístupov k MT sám o sebe nie je ideálnym univerzálnym nástrojom na riešenie akéhokoľvek prekladového problému;
Na vyriešenie problémov s obchodným prekladom môžu iba špecializované riešenia zaručiť súlad so všetkými požiadavkami.

Dospeli sme k úplne jasnému a logickému rozhodnutiu, že pre vaše prekladateľské úlohy musíte použiť prekladateľa, ktorý je na to najvhodnejší. Nezáleží na tom, či je vo vnútri neurónová sieť alebo nie. Pochopenie samotnej úlohy je dôležitejšie.

Štítky: Pridajte štítky

Existuje viac ako pol miliardy kópií webových stránok indexovaných vyhľadávačmi a celkový počet webových stránok je desaťtisíckrát vyšší. Obsah v ruskom jazyku zaberá 6 % celého internetu.

Ako preložiť želaný text rýchlo a tak, aby sa zachoval zamýšľaný význam autora. Staré metódy modulov štatistického prekladu obsahu fungujú veľmi pochybne, pretože... Nie je možné presne určiť deklináciu slov, čas atď. Povaha slov a spojenia medzi nimi sú zložité, a preto výsledok niekedy pôsobil veľmi neprirodzene.

Teraz Yandex používa automatický strojový preklad, ktorý zlepší kvalitu výsledného textu. Môžete si stiahnuť najnovšiu oficiálnu verziu prehliadača s novým vstavaným prekladom.

Hybridný preklad fráz a slov

Prehliadač Yandex je jediný, ktorý dokáže preložiť stránku ako celok, ako aj jednotlivé slová a frázy. Funkcia bude veľmi užitočná pre tých používateľov, ktorí viac-menej hovoria cudzím jazykom, no niekedy majú problémy s prekladom.

Neurónová sieť zabudovaná do mechanizmu prekladu slov si nie vždy poradila so zadanými úlohami, pretože Bolo mimoriadne ťažké vložiť do textu vzácne slová a urobiť ho čitateľným. Teraz bola do aplikácie zabudovaná hybridná metóda využívajúca staré a nové technológie.

Mechanizmus je takýto: program akceptuje vybrané vety alebo slová, potom ich odovzdá modulom neurónovej siete a štatistickému prekladaču a vstavaný algoritmus určí, ktorý výsledok je lepší, a potom ho poskytne používateľovi.

Prekladač neurónových sietí

Zahraničný obsah je formátovaný veľmi špecifickým spôsobom:

  • prvé písmená slov v nadpisoch sa píšu veľkými písmenami;
  • vety sú konštruované so zjednodušenou gramatikou, niektoré slová sú vynechané.

Navigačné ponuky na webových stránkach sa analyzujú s prihliadnutím na ich umiestnenie, napríklad slovo Späť, správne preložené späť (vrátiť sa späť), a nie späť.

Aby sa zohľadnili všetky vyššie uvedené vlastnosti, vývojári dodatočne vytrénovali neurónovú sieť, ktorá už využíva obrovské množstvo textových údajov. Teraz je kvalita prekladu ovplyvnená umiestnením obsahu a jeho dizajnom.

Výsledky aplikovaného prekladu

Kvalitu prekladu je možné merať pomocou algoritmu BLEU*, ktorý porovnáva strojový preklad a profesionálny preklad. Stupnica kvality od 0 do 100%.

Čím lepší je nervový preklad, tým vyššie je percento. Podľa tohto algoritmu začal prehliadač Yandex prekladať 1,7-krát lepšie.

Služba Yandex.Translator začala pri preklade textov využívať technológie neurónových sietí, čo umožňuje zlepšiť kvalitu prekladu, informoval web Yandex.

Do záložiek

Služba funguje na hybridnom systéme, vysvetlil Yandex: do štatistického modelu, ktorý beží v Translatore od jeho spustenia, bola pridaná technológia prekladu pomocou neurónovej siete.

„Na rozdiel od štatistického prekladača neurónová sieť nerozdeľuje texty na jednotlivé slová a frázy. Ako vstup dostane celý návrh a vydá jeho preklad,“ vysvetlil zástupca spoločnosti. Tento prístup podľa neho umožňuje brať do úvahy kontext a lepšie sprostredkovať význam prekladaného textu.

Štatistický model si zase lepšie poradí so zriedkavými slovami a frázami, zdôraznil Yandex. „Ak význam vety nie je jasný, nefantazíruje, ako to dokáže neurónová sieť,“ poznamenala spoločnosť.

Pri preklade služba využíva oba modely, potom algoritmus strojového učenia výsledky porovnáva a podľa jej názoru ponúka najlepšiu možnosť. „Hybridný systém vám umožňuje získať to najlepšie z každej metódy a zlepšiť kvalitu prekladu,“ hovorí Yandex.

V priebehu dňa 14. septembra by sa vo webovej verzii Translatoru mal objaviť prepínač, s ktorým môžete porovnávať preklady vykonávané hybridným a štatistickým modelom. Zároveň niekedy služba nemusí zmeniť texty, spoločnosť poznamenala: "To znamená, že hybridný model rozhodol, že štatistický preklad je lepší."

Yandex.Translator sa naučil spriateliť sa s neurónovou sieťou a poskytnúť používateľom kvalitnejšie texty. Yandex začal používať hybridný prekladový systém: spočiatku fungoval štatisticky a teraz je doplnený o technológiu strojového učenia CatBoost. Pravda, je tu jedna vec. Zatiaľ len na preklad z angličtiny do ruštiny.

Yandex tvrdí, že ide o najobľúbenejší smer prekladu, ktorý predstavuje 80% z celkového počtu.

CatBoost je inteligentná vec, ktorá po prijatí dvoch verzií prekladu ich porovnáva a vyberá tú, ktorá sa najviac podobá ľuďom.

V štatistickej verzii je preklad zvyčajne rozčlenený na jednotlivé frázy a slová. Neurona to nerobí, analyzujem vetu ako celok, berúc do úvahy, ak je to možné, kontext. Preto je veľmi podobný ľudskému prekladu, pretože neurónová sieť môže brať do úvahy slovné dohody. Štatistický prístup má však aj svoje výhody, keď nefantazíruje, ak vidí zriedkavé alebo nejasné slovo. neurónová sieť sa môže pokúsiť byť kreatívna.

Po dnešnom oznámení by sa mal počet gramatických chýb v automatických prekladoch znížiť. Teraz prechádzajú jazykovým modelom. Teraz by ste nemali naraziť na momenty ako „ocko je preč“ alebo „silná bolesť“.

Vo webovej verzii v tento moment používatelia si môžu vybrať verziu prekladu, ktorá sa im zdá najsprávnejšia a najúspešnejšia, existuje na to samostatný spúšťač.

Ak vás zaujímajú novinky zo sveta IT rovnako ako nás, prihláste sa na odber nášho kanála Telegram. Všetky materiály sa tam objavia čo najrýchlejšie. Alebo možno je to pre vás pohodlnejšie? Sme dokonca v .

Páčil sa vám článok?

Alebo aspoň zanechajte veselý komentár, aby sme vedeli, ktoré témy sú pre čitateľov najzaujímavejšie. Okrem toho nás to inšpiruje. Formulár komentárov je uvedený nižšie.

Čo je s ňou? Svoje rozhorčenie môžete vyjadriť na [e-mail chránený]. V budúcnosti sa pokúsime zohľadniť vaše želania, aby sme zlepšili kvalitu materiálov stránky. Teraz poďme utrácať výchovná práca s autorom.

Táto poznámka je veľkým komentárom k novinkám o prekladači Google, ktorý spája ruský jazyk s prekladom s hlbokým učením. Na prvý pohľad všetko znie a vyzerá veľmi cool. Vysvetlím však, prečo by ste sa nemali ponáhľať so závermi o tom, že „prekladatelia už nie sú potrební“.


Trik je v tom, že dnešná technológia môže nahradiť... no, nemôže nahradiť nikoho.
Prekladateľ nie je ten, kto vie cudzí jazyk, rovnako ako fotograf nie je ten, kto si kúpil veľkú čiernu zrkadlovku. Toto je nevyhnutná podmienka, ale zďaleka nie postačujúca.

Prekladateľ je niekto, kto veľmi dobre pozná svoj vlastný jazyk, dobre rozumie jazyku niekoho iného a dokáže presne vyjadriť významové nuansy.

Všetky tri podmienky sú dôležité.

Zatiaľ sme nevideli ani prvý diel (v zmysle „vie svoj vlastný jazyk“). Teda aspoň pre Rusov je zatiaľ všetko veľmi, veľmi zlé. To je niečo, ale umiestnenie čiarok je dokonale algoritmizované (Word to urobil v roku 1994, licencoval algoritmus od miestnych) a pre neurónovú sieť existujúceho textového korpusu OSN je to jednoducho za strechou.

Pre tých, ktorí nevedia, všetky oficiálne dokumenty OSN sú vydané v piatich jazykoch stálych členov Bezpečnostnej rady, vrátane ruštiny, a toto je najväčšia databáza veľmi kvalitných prekladov tých istých textov pre týchto päť jazykoch. Na rozdiel od prekladov umelecké práce, kde „môže byť potrestaný prekladateľ Ostap“, sa základňa OSN vyznačuje najpresnejším prenosom najjemnejších významových odtieňov a ideálnym súladom s literárnymi normami.

Tento fakt a jeho absolútna voľnosť z neho robí ideálny súbor textov (korpus) na školenie umelých prekladateľov, hoci pokrýva len čisto úradnú a byrokratickú podmnožinu jazykov.


Vráťme sa k našim ovečkám prekladateľom. Podľa Paretovho zákona je 80 % profesionálnych prekladateľov zlých. Ide o ľudí, ktorí absolvovali kurzy cudzích jazykov alebo v lepšom prípade nejaký regionálny pedagogický inštitút so špecializáciou „učiteľ cudzích jazykov na základnej škole pre vidiek“. A nemajú žiadne iné vedomosti. Inak by nesedeli v jednej z najhoršie platených prác.

Viete, ako zarábajú peniaze? Nie, nie na prekladoch. Zákazníci týchto prekladov spravidla rozumejú textu v cudzí jazyk lepší prekladateľ.

Riadia sa požiadavkami legislatívy a/alebo miestnych zvyklostí.

Sme povinní mať pokyny k produktu v ruštine. Dovozca si preto nájde človeka, ktorý trochu ovláda „importovaný“ jazyk a tento návod preloží. Táto osoba nepozná produkt, nemá v tejto oblasti žiadne znalosti, v ruštine mal „C-mínus“, ale prekladá. Výsledok je každému známy.

Ešte horšie je, ak sa prekladá „v opačnom smere“, t.j. do cudzieho jazyka (ahoj Číňanom). Potom jeho práca s najväčšou pravdepodobnosťou spadá do Exlerových „bannismov“ alebo ich miestnych analógov.

Alebo je tu pre vás zložitejší prípad. Pri kontakte s vládou orgány so zahraničnými dokladmi musia predložiť preklad týchto dokladov. Okrem toho by preklad nemal byť od strýka Vasyu, ale z právne rešpektovanej kancelárie, s „mokrými“ pečaťami atď. No povedzte, aké ťažké je „preložiť“ vodičský preukaz alebo rodný list? Všetky polia sú štandardizované a očíslované. „Prekladateľ“ potrebuje v najhoršom prípade jednoducho prepísať vlastné mená z jednej abecedy do druhej. Ale nie, „strýko Vasja“ odpočíva, a to častejšie ani nie vďaka zákonu, ale jednoducho interným pokynom miestnych byrokratických nadriadených.

Upozorňujeme, že v 80 % prekladateľských firiem pracujú notári. Hádajte trikrát prečo?

Ako týchto prekladateľov ovplyvní nástup dobrého strojového prekladu? V žiadnom prípade. No, to je. je nádej, že kvalita ich prekladov sa v niektorých malých aspektoch, kde je čo prekladať, ešte zlepší. To je všetko. Pracovný čas tu sa to výrazne nezníži, pretože väčšinu času stále kopírujú text zo stĺpca do stĺpca. “Tento syr obsahuje toľko bielkovín, toľko sacharidov...” Národné formy v rozdielne krajiny iné, takže pre nich nebude o nič menej práce. Najmä ak sa nesnažíte.

Predbežný záver: pre spodných 80 % sa nič nezmení. Už zarábajú nie preto, že sú prekladatelia, ale preto, že sú byrokrati na najnižšej úrovni.

Teraz sa pozrime na opačnú časť spektra, dobre, nech sú to horné 3 %.

Najzodpovednejšie, aj keď nie technicky najzložitejšie 1 %: simultánny preklad veľmi dôležité rokovania Zvyčajne medzi veľké korporácie, ale v limite - pri OSN alebo podobných vrcholoch. Jedna chyba prekladateľa pri sprostredkovaní ani nie významu – emócií, môže viesť v najhoršom prípade až k jadrovej vojne. Zároveň, ako viete, emocionálne zafarbenie dokonca doslova zhodných fráz v rôznych jazykoch môže byť veľmi odlišné. Tie. prekladateľ musí v ideálnom prípade poznať oba kultúrne kontexty svojich pracovných jazykov. Banálnymi príkladmi sú slová „negro“ a „zdravotne postihnuté“. V ruštine sú takmer neutrálne a v modernej angličtine jasne emotívne, až obscénne.

Takíto prekladatelia sa nemusia AI báť: nikto by nikdy nezveril takú zodpovednosť stroju.

Ďalšie 1 % tvoria literárni prekladatelia. No napríklad mám celú policu venovanú starostlivo zozbieraným pôvodným anglickým vydaniam Conana Doyla, Lewisa Carrolla, Hugha Laurieho – v origináli, bez akýchkoľvek úprav či našich lokálnych dotlačov. Čítanie týchto kníh je skvelé pre rozvoj. lexikón, viete, no, okrem veľkého estetického potešenia. Ja, certifikovaný prekladateľ, dokážem prerozprávať akúkoľvek vetu z týchto kníh veľmi blízko textu. Ale vziať na preklad? Bohužiaľ nie.

O prekladoch poézie ani nehovorím.

Napokon, technicky najťažšie (pre neurónovú sieť - vo všeobecnosti nemožné) 1% je vedecký a technický preklad. Zvyčajne, ak nejaký tím v niektorej krajine prevzal vedenie vo svojom odbore, svoje objavy a vynálezy pomenuje vo svojom jazyku. Môže sa ukázať, že v inej krajine iný tím nezávisle vynašiel/objavil to isté. Takto sa objavili napríklad zákony Boyle-Mariotte, Mendelejev-Poisson a spory na tému Popov / Marconi, Mozhaisky / bratia Wrightovci / Santos-Dumont.

Ak však zahraničný tím „úplne predbehol“, „dobiehajúci“ vedci majú dve možnosti v lingvistickom zmysle: sledovanie alebo preklad.

Kopírovanie názvov nových technológií je samozrejme jednoduchšie. Takto sa objavili v ruštine algebra, liek A počítač, francuzsky - bistro, datcha A vodka; v angličtine - satelit, tokamak A perestrojky.

Ale niekedy predsa prekladajú. Hlas humanistu v mojej hlave sa divoko rúti pri termíne tachsota na označenie argumentu Fourierovej transformácie z Fourierovej transformácie, ako preklad pre querqueency. Žarty bokom, v Googli takéto výrazy nie sú – ja však mám papierovú učebnicu digitálneho spracovania signálov, schválenú a posvätenú ministerstvom školstva, v ktorej sa tieto výrazy nachádzajú.

A áno, analýza dotykových buniek je jediný (pre mňa známy) spôsob rozlíšenia mužský hlas od ženského. Možnosti?

Narážam na to, že títo ľudia sa nemajú čoho báť, pretože sami tvoria jazyk, zavádzajú doň nové slová a výrazy. Neurónové siete sa len učia z ich rozhodnutí. No, netreba zabúdať na fakt, že títo vedci a inžinieri nezarábajú na prekladoch.

A nakoniec, „stredná trieda“, dobrá profesionálnych prekladateľov, ale nie topy. Na jednej strane ich stále chráni byrokracia - prekladajú napríklad návody, ale nie pre homeopatické doplnky stravy, ale napríklad pre normálne lieky či stroje. Na druhej strane sú to dnes moderní pracovníci s vysokou automatizáciou práce. Ich práca už začína zostavovaním „slovníka“ pojmov tak, aby bol preklad jednotný, a potom v podstate spočíva v úprave textu v špecializovanom softvéri ako je trados. Neurónové siete znížia počet potrebných úprav a zvýšia produktivitu práce, ale zásadne nič nezmenia.

Stručne povedané, povesti o blížiacej sa smrti povolania obyčajného prekladateľa sú mierne prehnané. Na všetkých úrovniach sa trochu zrýchli práca a trochu sa zvýši konkurencia, ale nič neobvyklé.

Kto to však získa, sú prekladatelia a novinári. Len pred 10 rokmi sa mohli kľudne odvolať na článok v angličtine, z ktorého ničomu nerozumeli, a napísať úplné nezmysly. Dnes sa o to tiež pokúšajú, ale čitatelia, ktorí vedia po anglicky, ich opakovane namočia do... no, chápete.

Vo všeobecnosti ich čas uplynul. S univerzálnym strojovým prekladačom strednej úrovne, aj keď trochu nemotorným, „novinári“ ako