Blog 23. 8. 2022

Doménová adaptace překladače

Proces přizpůsobení obecného překladače se nazývá doménová adaptace. Obvykle postupujeme tak, že nejdříve natrénujeme překladový model na obecných datech pro daný jazykový pár. Mezi taková data patří například přeložené novinové články, manuály různých aplikací, články z Wikipedie, projevy z Evropského parlamentu, titulky k filmům a seriálům a mnohá další. Takto připravený základní překladač můžete vyzkoušet například na https://prekladac.lingea.cz/

Poté je potřeba získat trénovací data z dané domény – doména může být poměrně obecná, například zdraví, cestovní ruch nebo webový prodej služeb, ale i specifičtější, například uživatelské příručky k pračkám. Ideální jsou paralelní data, tedy taková, kde jsou k dispozici zdrojové věty i překlad. V některých případech k efektivní adaptaci stačí i text, který je k dispozici pouze v cílovém jazyce. Vždy je ale potřeba velké množství těchto dat – minimálně desetitisíce, spíše však statisíce vět. Tato data můžeme přímo použít jednak pro trénování, jednak pro výběr dalších vhodných překladů z obecných korpusů na základě podobnosti textů.

Jakmile máme připravený trénovací korpus, můžeme konečně provést vlastní doménovou adaptaci, která spočívá v dotrénování obecného modelu s použitím vybraných doménových dat. Na malé části dat, která jsme ponechali stranou, můžeme pak sledovat kvalitu překladu a na základě toho provádět změny v procesu přípravy dat a trénování modelu, dokud nedosáhneme uspokojivého výsledku. Konečný výsledek, tedy rozdíl mezi adaptovaným a neadaptovaným modelem, můžete posoudit na následujících obrázcích.   

google_both.png (70 KB)

Na první obrazovce vidíte výsledky překladu pomocí služby Google Translate. Výsledný text je sice česky, ale není příliš srozumitelný, bez přečtení původního anglického textu uživatel někdy těžko chápe, o čem se v odstavcích píše.

neadapt_both.png (44 KB)

Na této obrazovce je výsledek obecného překladače Lingea. Text je o poznání čitelnější, ale stále to není úplně ono.

tygeris_both2.png (62 KB)

Zde vidíte výsledek překladu, který vznikl adaptací obecného překladače na texty z oblasti cestovního ruchu. Vidíte, že výsledný text je krásně čitelný a téměř bez chyb.

Je zřejmé, že takto vytvořený speciální překladač dokáže překladatelům ušetřit spoustu času a zkrátit proces lokalizace textů do češtiny. Současně ale musíme zdůraznit, že samotná příprava vyladěného překladače trvá několik dní či týdnů a vyplatí se proto až při překladu většího množství textu, řádově stovek či tisíců normostran.

Poté je potřeba získat trénovací data z dané domény – doména může být poměrně obecná, například zdraví, cestovní ruch nebo webový prodej služeb, ale i specifičtější, například uživatelské příručky k pračkám. Ideální jsou paralelní data, tedy taková, kde jsou k dispozici zdrojové věty i překlad. V některých případech k efektivní adaptaci stačí i text, který je k dispozici pouze v cílovém jazyce. Vždy je ale potřeba velké množství těchto dat – minimálně desetitisíce, spíše však statisíce vět. Tato data můžeme přímo použít jednak pro trénování, jednak pro výběr dalších vhodných překladů z obecných korpusů na základě podobnosti textů.

Jakmile máme připravený trénovací korpus, můžeme konečně provést vlastní doménovou adaptaci, která spočívá v dotrénování obecného modelu s použitím vybraných doménových dat. Na malé části dat, která jsme ponechali stranou, můžeme pak sledovat kvalitu překladu a na základě toho provádět změny v procesu přípravy dat a trénování modelu, dokud nedosáhneme uspokojivého výsledku. Konečný výsledek, tedy rozdíl mezi adaptovaným a neadaptovaným modelem, můžete posoudit na následujících obrázcích.   

google_both.png (70 KB)

Na první obrazovce vidíte výsledky překladu pomocí služby Google Translate. Výsledný text je sice česky, ale není příliš srozumitelný, bez přečtení původního anglického textu uživatel někdy těžko chápe, o čem se v odstavcích píše.

neadapt_both.png (44 KB)

Na této obrazovce je výsledek obecného překladače Lingea. Text je o poznání čitelnější, ale stále to není úplně ono.

tygeris_both2.png (62 KB)

Zde vidíte výsledek překladu, který vznikl adaptací obecného překladače na texty z oblasti cestovního ruchu. Vidíte, že výsledný text je krásně čitelný a téměř bez chyb.

Je zřejmé, že takto vytvořený speciální překladač dokáže překladatelům ušetřit spoustu času a zkrátit proces lokalizace textů do češtiny. Současně ale musíme zdůraznit, že samotná příprava vyladěného překladače trvá několik dní či týdnů a vyplatí se proto až při překladu většího množství textu, řádově stovek či tisíců normostran.

Doménová adaptace překladače
Jaro plné knih a cestování: 3 veletrhy, kde se můžeme v březnu potkat
Pozvánka 5. 3. 2026

Jaro plné knih a cestování: 3 veletrhy, kde se můžeme v březnu potkat

Začátek jara je opravdu bohatý na skvělé akce pro všechny cestovatele, kde se můžeme vidět osobně a načerpat inspiraci. Zveme vás hned na 3 veletrhy a festivaly, kam se vydáme s našimi cestovatelskými průvodci.

Pozvánka: Knižní festival Ostrava 2026
Pozvánka 13. 2. 2026

Pozvánka: Knižní festival Ostrava 2026

Zastavte se za námi 20.–⁠⁠⁠⁠⁠⁠21. 2. v Ostravě na Černé louce! Ve stánku nakladatelství Lingea na vás budou čekat naše čerstvé novinky, osvědčené bestsellery i veletržní sleva na všechny tituly.

Konference pro lepší angličtinu: Meet. Share. Inspire.
Pozvánka 3. 2. 2026

Konference pro lepší angličtinu: Meet. Share. Inspire.

Lingea je opět partnerem prestižní konference pro učitele angličtiny, která má motto Meet. Share. Inspire. Letos na ní představíme třeba novinky u online slovníků.

Kniha Brno 2025: Redaktor Martin Hromek představuje novinku Suroviny a moc
Pozvánka 29. 10. 2025

Kniha Brno 2025: Redaktor Martin Hromek představuje novinku Suroviny a moc

V neděli 2. listopadu od 15.00 hod. zveme na besedu s naším redaktorem Martinem Hromkem na veletrhu Kniha Brno. Představí vám skvělou podzimní novinku Suroviny a moc. Navštivte nás také na stánku č. 29 a využijte veletržní slevu na všechny knihy.

Pozvánka: Uvedení novinek z řady Mýty a legendy v Anthroposu
Pozvánka 27. 10. 2025

Pozvánka: Uvedení novinek z řady Mýty a legendy v Anthroposu

Srdečně vás zveme na slavnostní uvedení 2 nejnovějších titulů z řady Mýty a legendy: Dívka v krokodýlí kůži a Ozvěny bouře mečů. Už 15. listopadu od 15.00 hodin v brněnském Anthroposu s autorem Ondřejem Pivodou a ilustrátorem Vladimírem Rimbalou.

Pozvánka: 35. Podzimní knižní veletrh v Havlíčkově Brodě
Pozvánka 9. 10. 2025

Pozvánka: 35. Podzimní knižní veletrh v Havlíčkově Brodě

Udělejte si výlet do Havlíčkova Brodu! Už tento týden (10. a 11. října) se tam v Kulturním domě Ostrov a v Krajské knihovně Vysočiny koná 35. ročník Podzimního knižního veletrhu.

Porto, Sevilla, Budapešť: Oblíbená řada průvodců Michelin Víkend se opět rozrůstá
Novinka 25. 8. 2025

Porto, Sevilla, Budapešť: Oblíbená řada průvodců Michelin Víkend se opět rozrůstá

Z tiskárny nám právě dorazilo Porto, které je zcela novou destinací. A také nová vydání Sevilly a Budapešti. Opětovně je dostupná také Madeira, která byla vyprodaná.

Chystáte se do Kodaně nebo na Sicílii? Objevte čerstvé novinky z edice Do kapsy
Novinka 18. 8. 2025

Chystáte se do Kodaně nebo na Sicílii? Objevte čerstvé novinky z edice Do kapsy

Ať už se chystáte prozkoumávat krásy severu, nebo vás láká třeba Itálie, průvodce z řady Do kapsy je vždy dobrou volbou. Hned 7 destinací právě vychází v novém aktualizovaném vydání.

Knižní festival Ostrava 2025
Pozvánka 18. 3. 2025

Knižní festival Ostrava 2025

Objevte novinky a setkejte se s autory! Přijďte si užít svět knih, inspirativní besedy a autorská čtení na Výstavišti Černá louka (21.–22. března 2025). Zastavte se u našeho stánku a prolistujte si nejnovější knižní tituly!

Naplánujte svou příští cestu – inspirujte se na veletrhu!
Pozvánka 5. 3. 2025

Naplánujte svou příští cestu – inspirujte se na veletrhu!

Cestovatelský svátek je tady! Navštivte nás na veletrhu Holiday World & Region World v Praze a pořiďte průvodce na svoje cesty za výhodné ceny!

Poznejte země Vikingů, trolů a přírodních krás
Novinka 21. 6. 2024

Poznejte země Vikingů, trolů a přírodních krás

Skandinávie vás nadchne nádhernou přírodou, všudypřítomnou pohodou, historickými památkami i moderní architekturou. Nabízí také nevšední možnosti relaxace. Přijeďte na sever Evropy a nechte se strhnout skandinávskou dobrou náladou.

Řecko, země mytologie, historie a přírodního bohatství
Novinka 12. 6. 2024

Řecko, země mytologie, historie a přírodního bohatství

Řecko je zemí starověkých bohů a hrdinských legend. Je známé svou neuvěřitelnou historií, bohatou kulturou a nádhernými ostrovy, které rozkvétají ve Středozemním moři. Prohlédněte si naše tipy, kam letos v létě vyrazit.

První multimediální slovník češtiny
Novinka 2. 5. 2024

První multimediální slovník češtiny

Na portálu Nechybujte.cz jsme zveřejnili aktualizovanou verzi výkladového slovníku češtiny – v současné době největší a nejaktuálnější zdroj informací o češtině online! K čemu takový slovník je?

Legendární hrdinové v komiksu
Novinka 2. 4. 2024

Legendární hrdinové v komiksu

Nejnovější vlna komiksů přenáší čtenáře do časů dávno minulých a vdechuje život historickým osobnostem i postavám řecké mytologie. Na jejich stránkách se odvíjejí příběhy známých hrdinů, kteří utvářeli náš svět.

Odhalujeme fascinující vesmírné fenomény
Novinka 20. 3. 2024

Odhalujeme fascinující vesmírné fenomény

Prozkoumejte VLNY: Atlas pohybu moře a KOMETY: Atlas velkých vlasatic. Nové artové publikace s půvabnými ilustracemi vás pohladí po duši a zároveň přimějí zamyslet se nad otázkami přírody, které lidstvo fascinují od nepaměti.

Duševní zdraví dětí
Novinka 5. 3. 2024

Duševní zdraví dětí

Sleva 20 % na knížky o duševním zdraví dětí pouze do 31. 3. 2024. Ukažte svým dětem, jak se vypořádat s novými výzvami, získat zdravou sebedůvěru nebo se starat o svou psychickou pohodu a vztahy s druhými.

Efektivní strojový překlad: Průvodce pro úspěch v B2B
Blog 27. 9. 2023

Efektivní strojový překlad: Průvodce pro úspěch v B2B

S pomocí strojového překladu můžeme dnes ve světě obchodu snadno komunikovat napříč různými jazyky. Tento článek přináší praktické tipy, jak využít tento úžasný nástroj pro lepší spolupráci.

Slovníky Lingea – proč je používat a jak z nich vybírat?
Blog 9. 6. 2023

Slovníky Lingea – proč je používat a jak z nich vybírat?

Mají slovníky své místo i v době AI a strojového překladu?

Nejlepší destinace v Itálii pro vaši dovolenou
Novinka 31. 5. 2023

Nejlepší destinace v Itálii pro vaši dovolenou

Zažijte Itálii jako nikdy předtím a odhalte její skryté poklady, bohatou historii i autentickou atmosféru. Připravili jsme pro vás tipy na průvodce, které vám doporučí nejzajímavější místa a poradí, jak si pobyt co nejvíce užít, i když do Itálie míříte opakovaně.

Strojové překlady a nové technologie
Blog 11. 4. 2023

Strojové překlady a nové technologie

Jak nové technologie vylepšují kvalitu strojového překladu?

Slovník nebo překladač?
Blog 25. 1. 2023

Slovník nebo překladač?

Patří budoucnost strojovému překladu a skončí slovníky na smetišti dějin?

Integrace terminologie do překladače
Blog 16. 9. 2022

Integrace terminologie do překladače

Jak zajistit, aby odborné termíny byly vždy přeloženy správně?

Zobrazuje se 1–3 z 22