Integrace terminologie do překladače
Nedávno jsme publikovali článek, který se zabýval doménovou adaptací modelů pro strojový překlad. Dalším úzce souvisejícím nástrojem, který je velmi užitečný obzvlášť při překladu textů specializovaných na určitý obor, je integrace terminologických databází (někdy nazývané glosáře) do překladového procesu. Samotná doménová adaptace obecně přizpůsobí jazyk požadovanému oboru, často i zlepší překlad specializovaných termínů, ale integrace terminologie zajistí, že odborné termíny jsou za každých okolností přeloženy v souladu se zavedenými pravidly.
Pro příklad si uveďme anglickou větu určenou k překladu do češtiny:
Such was the decision by the Court of Justice of the European Union.
Z oficiální terminologické databáze pro instituce EU se dozvíme, že správný překlad Court of Justice of the European Union zní Soudní dvůr Evropské unie.
Nejdříve zkusme přeložit větu překladačem bez integrované terminologie, výsledkem je věta:
Takto rozhodl Evropský soudní dvůr.
Vidíme, že nebyl zachován správný překlad termínu. Jak to lze řešit?
Nejjednodušším přístupem je nahrazení termínu ve zdroji zástupnou značkou, kterou překladový model nechá nepřeloženou (ale na správném místě v cílové větě). Po překladu je tato značka nahrazena cílovou částí termínu.
Such was the decision by the <term-1>.
Takto rozhodl <term-1>. -> Takto rozhodl Soudní dvůr Evropské unie.
Tento přístup může dobře fungovat v jednoduchých případech, jeho nevýhodou je potřeba speciálně natrénovaného překladového modelu, který “ví”, že značku má kopírovat. Navíc při tomto postupu odstraňujeme část vstupní informace - překladač nevidí termín, který před nahrazením značkou obsahovala vstupní věta, což může vést ke zhoršení kvality překladu.
Například, pokud bychom ve větě These sandwiches are free nahradili slovo sandwich značkou pro termín (tedy vstup pro překladač by zněl These <term-1> are free), není jasné, jak přeložit výraz free - zdarma, nebo svobodný?
Další možností je překladači “napovědět”, tedy ve speciálním odděleném vstupu poskytnout požadované překlady termínů a upravit proces překladu tak, aby tyto byly vynuceny v překladu.
Such was the decision by the Court of Justice of the European Union + Soudní dvůr Evropské unie -> Takto rozhodl Soudní dvůr Evropské unie.
Tento jednoduchý přístup funguje uspokojivě pro jazyky, které nemají bohatou morfologii a k vyjadřování gramatických funkcí používají převážně jiné prostředky, než skloňování a podobné modifikace slov. Mezi ně patří například angličtina, která jako tzv. analytický jazyk používá k vyjádření velké části gramatických kategorií předložky a pomocná slova (výjimku tvoří např. časování sloves).
V jazycích aglutinačních (např. maďarština) a flektivních (např. čeština) však nastává problém - před překladem nevíme, v jaké formě se má termín v cílové větě přeložit, to lze určit až při znalosti kontextu celé přeložené věty. U popsaného postupu tedy může nastat tato situace:
Such was the decision by the Court of Justice of the European Union + Soudní dvůr Evropské unie -> Takové je rozhodnutí Soudní dvůr Evropské unie.
Jednou možností by bylo přeložit text se základním tvarem termínů a následně použít nástroj pro opravu gramatiky, ale tento přístup je těžkopádný a neposkytuje optimální výsledky (například proto, že model generuje překlad slovo po slovu a vždy se “dívá” na už vygenerovaná slova a termíny použité v nesprávném tvaru by mohly být matoucí).
Náš přístup využívá toho, že překladové modely založené na neuronových sítích dokáží velmi dobře modelovat jazyk, jinými slovy málokdy udělají chybu v gramatice (což může být někdy i jejich nevýhoda, stává se, že model vygeneruje velmi pěkně a důvěryhodně znějící větu, které ale není přesným překladem zdroje). Tuto schopnost modelů využíváme tak, že na vstupu poskytujeme pouze základní tvar termínu, který nazýváme lemma. Určení tohoto základního tvaru využívá dat připravených našimi lingvisty a slovníkáři v kombinaci s algoritmy pro zpracování slov, které se ve slovníku nenachází. Překladový model při trénování “naučíme”, že má takto poskytnuté termíny vždy ohnout tak, aby v kontextu celého vygenerovaného překladu byly ve správném tvaru. Výsledný překlad pak vypadá takto:
Such was the decision by the Court of Justice of the European Union + Soudní dvůr Evropské unie -> Takové je rozhodnutí Soudního dvoru Evropské unie.
Podrobnější informace o naší metodě lze nalézt buď přímo v článku, na kterém je založena, nebo v blogu poskytujícím shrnutí tohoto článku.
Jaro plné knih a cestování: 3 veletrhy, kde se můžeme v březnu potkat
Začátek jara je opravdu bohatý na skvělé akce pro všechny cestovatele, kde se můžeme vidět osobně a načerpat inspiraci. Zveme vás hned na 3 veletrhy a festivaly, kam se vydáme s našimi cestovatelskými průvodci.
Pozvánka: Knižní festival Ostrava 2026
Zastavte se za námi 20.–21. 2. v Ostravě na Černé louce! Ve stánku nakladatelství Lingea na vás budou čekat naše čerstvé novinky, osvědčené bestsellery i veletržní sleva na všechny tituly.
Konference pro lepší angličtinu: Meet. Share. Inspire.
Lingea je opět partnerem prestižní konference pro učitele angličtiny, která má motto Meet. Share. Inspire. Letos na ní představíme třeba novinky u online slovníků.
Kniha Brno 2025: Redaktor Martin Hromek představuje novinku Suroviny a moc
V neděli 2. listopadu od 15.00 hod. zveme na besedu s naším redaktorem Martinem Hromkem na veletrhu Kniha Brno. Představí vám skvělou podzimní novinku Suroviny a moc. Navštivte nás také na stánku č. 29 a využijte veletržní slevu na všechny knihy.
Pozvánka: Uvedení novinek z řady Mýty a legendy v Anthroposu
Srdečně vás zveme na slavnostní uvedení 2 nejnovějších titulů z řady Mýty a legendy: Dívka v krokodýlí kůži a Ozvěny bouře mečů. Už 15. listopadu od 15.00 hodin v brněnském Anthroposu s autorem Ondřejem Pivodou a ilustrátorem Vladimírem Rimbalou.
Pozvánka: 35. Podzimní knižní veletrh v Havlíčkově Brodě
Udělejte si výlet do Havlíčkova Brodu! Už tento týden (10. a 11. října) se tam v Kulturním domě Ostrov a v Krajské knihovně Vysočiny koná 35. ročník Podzimního knižního veletrhu.
Porto, Sevilla, Budapešť: Oblíbená řada průvodců Michelin Víkend se opět rozrůstá
Z tiskárny nám právě dorazilo Porto, které je zcela novou destinací. A také nová vydání Sevilly a Budapešti. Opětovně je dostupná také Madeira, která byla vyprodaná.
Chystáte se do Kodaně nebo na Sicílii? Objevte čerstvé novinky z edice Do kapsy
Ať už se chystáte prozkoumávat krásy severu, nebo vás láká třeba Itálie, průvodce z řady Do kapsy je vždy dobrou volbou. Hned 7 destinací právě vychází v novém aktualizovaném vydání.
Knižní festival Ostrava 2025
Objevte novinky a setkejte se s autory! Přijďte si užít svět knih, inspirativní besedy a autorská čtení na Výstavišti Černá louka (21.–22. března 2025). Zastavte se u našeho stánku a prolistujte si nejnovější knižní tituly!
Naplánujte svou příští cestu – inspirujte se na veletrhu!
Cestovatelský svátek je tady! Navštivte nás na veletrhu Holiday World & Region World v Praze a pořiďte průvodce na svoje cesty za výhodné ceny!
Poznejte země Vikingů, trolů a přírodních krás
Skandinávie vás nadchne nádhernou přírodou, všudypřítomnou pohodou, historickými památkami i moderní architekturou. Nabízí také nevšední možnosti relaxace. Přijeďte na sever Evropy a nechte se strhnout skandinávskou dobrou náladou.
Řecko, země mytologie, historie a přírodního bohatství
Řecko je zemí starověkých bohů a hrdinských legend. Je známé svou neuvěřitelnou historií, bohatou kulturou a nádhernými ostrovy, které rozkvétají ve Středozemním moři. Prohlédněte si naše tipy, kam letos v létě vyrazit.
První multimediální slovník češtiny
Na portálu Nechybujte.cz jsme zveřejnili aktualizovanou verzi výkladového slovníku češtiny – v současné době největší a nejaktuálnější zdroj informací o češtině online! K čemu takový slovník je?
Legendární hrdinové v komiksu
Nejnovější vlna komiksů přenáší čtenáře do časů dávno minulých a vdechuje život historickým osobnostem i postavám řecké mytologie. Na jejich stránkách se odvíjejí příběhy známých hrdinů, kteří utvářeli náš svět.
Odhalujeme fascinující vesmírné fenomény
Prozkoumejte VLNY: Atlas pohybu moře a KOMETY: Atlas velkých vlasatic. Nové artové publikace s půvabnými ilustracemi vás pohladí po duši a zároveň přimějí zamyslet se nad otázkami přírody, které lidstvo fascinují od nepaměti.
Duševní zdraví dětí
Sleva 20 % na knížky o duševním zdraví dětí pouze do 31. 3. 2024. Ukažte svým dětem, jak se vypořádat s novými výzvami, získat zdravou sebedůvěru nebo se starat o svou psychickou pohodu a vztahy s druhými.
Efektivní strojový překlad: Průvodce pro úspěch v B2B
S pomocí strojového překladu můžeme dnes ve světě obchodu snadno komunikovat napříč různými jazyky. Tento článek přináší praktické tipy, jak využít tento úžasný nástroj pro lepší spolupráci.
Slovníky Lingea – proč je používat a jak z nich vybírat?
Mají slovníky své místo i v době AI a strojového překladu?
Nejlepší destinace v Itálii pro vaši dovolenou
Zažijte Itálii jako nikdy předtím a odhalte její skryté poklady, bohatou historii i autentickou atmosféru. Připravili jsme pro vás tipy na průvodce, které vám doporučí nejzajímavější místa a poradí, jak si pobyt co nejvíce užít, i když do Itálie míříte opakovaně.
Strojové překlady a nové technologie
Jak nové technologie vylepšují kvalitu strojového překladu?
Slovník nebo překladač?
Patří budoucnost strojovému překladu a skončí slovníky na smetišti dějin?
Doménová adaptace překladače
Jak vypadá příprava adaptovaného překladače v praxi a jaké výsledky můžeme očekávat?
Zobrazuje se 1–3 z 22