NeTTT konference o strojovém překladu

Jaké jsou současné trendy v překladech a technologiích?

NeTTT konference o strojovém překladu, Rhodos 2022

Po dvouletém čekání způsobeném celosvětovou pandemií se ve dnech 2. - 7. července 2022 konala na řeckém ostrově Rhodos první mezinárodní konference New Trends in Translation and Technology (NeTTT).

Konferenci NeTTT předcházela dvoudenní letní škola neuronového strojového překladu (NMT), workshop o překladatelských technologiích pro kreativní domény, a 7. července ji uzavřela série tutorialů.

Na hlavní konferenci, která přivítala více než 170 delegátů, zaznělo 5 hlavních projevů (keynote speech), 65 ústních a 14 posterových prezentací. Včetně naší, ve které jsme představili svoji dlouhodobou práci na zlepšování překladu slovanských jazyků pomocí vícejazyčných modelů.

Cílem organizátorů bylo spojit akademiky z lingvistiky, překladatelství, strojového překladu, překladových technologií s vývojáři, odborníky z praxe (překladatelé) a poskytovateli jazykových služeb, kteří se zabývají různými aspekty překladů a technologií. Konference sloužila jako platforma pro diskusi o veškerém novém vývoji a postupech v oboru a jako prostředek k navázání kontaktů a spolupráce.

K hlavním poznatkům patří: "Překlad, technologie a terminologie jdou ruku v ruce s budoucností všech lingvistických profesí," jak napsal na Twitteru Rodolfo Maslias, vedoucí oddělení Koordinace terminologie v Evropském parlamentu.

Letní škola NMT (sobota a neděle, 2. - 3. července)

Během prvního dne letní školy měli účastníci možnost navštívit přednášku o NMT, kterou dopoledne přednesl Mikel Forcada, profesor na Universitat d'Alacant, a "pohrát si" s předtrénovanými modely.

V odpolední části Sheila Castilho, výzkumná pracovnice v centru ADAPT (Dublin City University), hovořila o základech hodnocení strojového překladu (MT), upozornila na složitost tohoto úkolu a seznámila účastníky s nástrojem PET, který slouží k následné úpravě a hodnocení strojového překladu.

Druhý den letní školy začal přednáškou Marcella Federica, hlavního vědeckého pracovníka v AWS AI Labs, který vysvětlil základy neuronových sítí.

Během odpoledního bloku Tharindu Ranasinghe, přednášející na University of Wolverhampton, představil modely sekvence-sekvence a vysvětlil, jak vytvořit systém NMT. "Když někdo řekne: 'Trénuji MT systém', chci, abyste si řekli: 'Aha, to zvládnu taky,'" řekl Ranasinghe.

Poslední řečník, Panos Kanavos, zakladatel společnosti Lexorama, hovořil o specializaci NMT a kontrole domén. Během praktické části Kanavos představil NeuralDesktop, přizpůsobitelný, doménově orientovaný a uživatelsky konfigurovatelný systém NMT.

Jako alternativa byl odpoledne nabídnut také workshop o překladatelských technologiích pro kreativní domény (texty, které se opírají o lidskou kreativitu použitou při jejich tvorbě – beletrie, filozofická díla, písně, projevy, filmy, počítačové hry, reklamy). Prezentace se zaměřily na posteditaci v literárním překladu, personalizované MT systémy pro literární překlad a počítačem podporovaný literární překlad (CALT).

Tato letní škola byla rozhodně přínosem (i díky přednášejícím, kteří o svých tématech hovořili s nadšením) pro ty, kteří se chtějí věnovat kariéře v oblasti MT/překladových technologií nebo kteří potřebují získat praktické dovednosti, jak vyvíjet vlastní systémy NMT. Na letní škole byly představeny jak základy, tak nejmodernější postupy a hodnocení, takže byla vhodná nejen pro pokročilé studenty, ale i pro začátečníky s malou znalostí programování.

Hlavní konference (pondělí až středa, 4. – 6. července)

Hlavní část konference zahájila Sharon O'Brienová, profesorka translatologie na Dublin City University, s hlavním projevem o „rozšířeném překladu“ (augmented translation).

Podle O'Brienové by augmentace měla vést nejen k lepším a rychlejším řešením, ale také k možnosti nalézt řešení problémů, které se dříve zdály neřešitelné.

Následovaly tři paralelní sekce na různá témata - například hodnocení strojového překladu, posteditace, překladatelské platformy, překladatelské pracovní postupy a automatizace, překlad řeči, audiovizuální překlad, podpora zpracování přirozeného jazyka (NLP) pro překlad, etika v MT, gender a inkluze v MT nebo školení překladatelů.

Následovali další hlavní řečníci, Valter Mavrič, ředitel překladatelské služby (DG TRAD) v Evropském parlamentu, a Merit-Ene Ilja, ředitelka pro překlady na Generálním ředitelství pro překlady (DGT) Evropské komise.

Mavrič ilustroval, jak se role překladatele v Evropském parlamentu v posledních letech vyvinula v roli všestranného jazykového profesionála. Hlavním úkolem jejich překladatelů je kromě poskytování vícejazyčných produktů i srozumitelná komunikace s různorodým publikem tak, aby podpořili pochopení práce Evropského parlamentu a jeho poslanců.

Merit-Ene Ilja hovořila o překladatelském ekosystému DGT, zejména o tom, jak "je DGT otevřeno přijímat to, co mohou technologie nabídnout". Jazykové technologie jsou považovány za klíčovou součást souboru zdrojů DGT, které umožňují efektivní a účinný překlad právních předpisů EU a komunikačních materiálů. Využívání výhod, které technologie nabízejí, je možné díky zaměstnancům a neustálým investicím do jejich profesního rozvoje (zvyšování jejich digitálních i tematických znalostí a dovedností v oblasti správy dat).

Yves Champollion, zakladatel společnosti Wordfast, hovořil o nových funkcích nástroje pro překladovou paměť a o tom, že "dalším převratem v překladatelské technologii bude hlasové diktování v kombinaci s prediktivním textem s podporou MT".

Přednášející z letní školy Marcello Federico a Mikel Forcada hovořili také o využití kontextových informací v MT (Federico představil výsledky práce provedené v AWS AI Labs, jak zlepšit NMT podle různých jazykových znaků, které závisejí na kontextových informacích, jako jsou styl překladu, charakteristika mluvčího, vztah mezi mluvčím a publikem nebo slovosled), respektive o právech na používání jazykových dat v MT (Forcada poskytl přehled různých zdrojů dat používaných v MT a o jejich autorství v průběhu jednotlivých kroků tvorby, péče a transformace těchto dat).

Workshop MultiTrainNMT (středa, 6. července)

Po skončení hlavní konference se konal workshop "Strojový překlad pro každého", který uspořádal tým MultiTrainNMT. MultiTrainNMT je projekt financovaný EU, jehož cílem je naučit technologie NMT studenty netechnických oborů a širší veřejnost, aby lépe porozuměli tomu, jak funguje a jak by se měl používat.

Na programu této akce bylo šest desetiminutových přednášek, v nichž účastníci prezentovali své zkušenosti s výukou MT pro studenty překladatelství nebo jazyků. Kromě toho tým MultiTrainNMT informoval účastníky o vydání knihy "Machine Translation for Everyone: Empowering Users in the Age of Artificial Intelligence". Jak na Twitteru uvedl Miguel A. Jimenez-Crespo, docent na Rutgers University, kniha je "povinnou četbou pro každého, kdo se o toto téma zajímá". Pro účastníky workshopu (tedy i pro nás) je kniha k dispozici jako pdf, případně je možnost zaslání fyzického výtisku poštou (podle preferencí na základě vyplněného dotazníku, který zasílal Mikel Forcada po skočení konference; cílem dotazníku bylo shromáždit nápady pro výuku studentů MT, které zazněly ve druhé části workshopu).

Tutorialy (čtvrtek, 7. července)

Čtvrtek byl zaměřený na tutorialy, které zahájil Jorge Dias Cintas, profesor na University College London, a učil účastníky titulkovat v cloudu pomocí platformy OOONA (možnosti, které nabízejí cloudové ekosystémy, a hlavní podobnosti a rozdíly proti tradičním softwarovým programům, dále přehled o tom, jak se do úkolů spojených s titulkováním začleňuje strojový překlad a jak je možné posteditaci titulků využít ve výuce).

Dále Ricardo Munoz, řádný profesor na Boloňské univerzitě, představil Inputlog, nástroj pro zaznamenávání a výzkum procesů psaní (keylogger, který zaznamenává vše, co se dělá na klávesnici a myší – nové způsoby přístupu ke studiu jejich výstupů mohou vést k převratným zjištěním o chování komunikujících lidí, a to díky rozlišení úmyslných a neúmyslných pauz, jejich kategorizaci a členění).

Závěrečnou prezentaci přednesla Anna Zaretskaya, ředitelka pro strategii a implementaci MT ve společnosti TransPerfect, která hovořila o posteditaci pro média a titulky. Zaretskaya také představila pracovní postupy tvorby titulků řízené umělou inteligencí společnosti TransPerfect prostřednictvím platformy MediaNEXT (různé přístupy k posteditaci v závislosti na konečném cíli, typu posteditace a požadované kvalitě překladu).

NeTTT strojový překlad překladatelské technologie

Marek Švanda
15.07.2022