Doménová adaptace překladače
Proces přizpůsobení obecného překladače se nazývá doménová adaptace. Obvykle postupujeme tak, že nejdříve natrénujeme překladový model na obecných datech pro daný jazykový pár. Mezi taková data patří například přeložené novinové články, manuály různých aplikací, články z Wikipedie, projevy z Evropského parlamentu, titulky k filmům a seriálům a mnohá další. Takto připravený základní překladač můžete vyzkoušet například na https://prekladac.lingea.cz/.
Poté je potřeba získat trénovací data z dané domény – doména může být poměrně obecná, například zdraví, cestovní ruch nebo webový prodej služeb, ale i specifičtější, například uživatelské příručky k pračkám. Ideální jsou paralelní data, tedy taková, kde jsou k dispozici zdrojové věty i překlad. V některých případech k efektivní adaptaci stačí i text, který je k dispozici pouze v cílovém jazyce. Vždy je ale potřeba velké množství těchto dat – minimálně desetitisíce, spíše však statisíce vět. Tato data můžeme přímo použít jednak pro trénování, jednak pro výběr dalších vhodných překladů z obecných korpusů na základě podobnosti textů.
Jakmile máme připravený trénovací korpus, můžeme konečně provést vlastní doménovou adaptaci, která spočívá v dotrénování obecného modelu s použitím vybraných doménových dat. Na malé části dat, která jsme ponechali stranou, můžeme pak sledovat kvalitu překladu a na základě toho provádět změny v procesu přípravy dat a trénování modelu, dokud nedosáhneme uspokojivého výsledku. Konečný výsledek, tedy rozdíl mezi adaptovaným a neadaptovaným modelem, můžete posoudit na následujících obrázcích.

Na první obrazovce vidíte výsledky překladu pomocí služby Google Translate. Výsledný text je sice česky, ale není příliš srozumitelný, bez přečtení původního anglického textu uživatel někdy těžko chápe, o čem se v odstavcích píše.

Na této obrazovce je výsledek obecného překladače Lingea. Text je o poznání čitelnější, ale stále to není úplně ono.

Zde vidíte výsledek překladu, který vznikl adaptací obecného překladače na texty z oblasti cestovního ruchu. Vidíte, že výsledný text je krásně čitelný a téměř bez chyb.
Je zřejmé, že takto vytvořený speciální překladač dokáže překladatelům ušetřit spoustu času a zkrátit proces lokalizace textů do češtiny. Současně ale musíme zdůraznit, že samotná příprava vyladěného překladače trvá několik dní či týdnů a vyplatí se proto až při překladu většího množství textu, řádově stovek či tisíců normostran.
Poté je potřeba získat trénovací data z dané domény – doména může být poměrně obecná, například zdraví, cestovní ruch nebo webový prodej služeb, ale i specifičtější, například uživatelské příručky k pračkám. Ideální jsou paralelní data, tedy taková, kde jsou k dispozici zdrojové věty i překlad. V některých případech k efektivní adaptaci stačí i text, který je k dispozici pouze v cílovém jazyce. Vždy je ale potřeba velké množství těchto dat – minimálně desetitisíce, spíše však statisíce vět. Tato data můžeme přímo použít jednak pro trénování, jednak pro výběr dalších vhodných překladů z obecných korpusů na základě podobnosti textů.
Jakmile máme připravený trénovací korpus, můžeme konečně provést vlastní doménovou adaptaci, která spočívá v dotrénování obecného modelu s použitím vybraných doménových dat. Na malé části dat, která jsme ponechali stranou, můžeme pak sledovat kvalitu překladu a na základě toho provádět změny v procesu přípravy dat a trénování modelu, dokud nedosáhneme uspokojivého výsledku. Konečný výsledek, tedy rozdíl mezi adaptovaným a neadaptovaným modelem, můžete posoudit na následujících obrázcích.

Na první obrazovce vidíte výsledky překladu pomocí služby Google Translate. Výsledný text je sice česky, ale není příliš srozumitelný, bez přečtení původního anglického textu uživatel někdy těžko chápe, o čem se v odstavcích píše.

Na této obrazovce je výsledek obecného překladače Lingea. Text je o poznání čitelnější, ale stále to není úplně ono.

Zde vidíte výsledek překladu, který vznikl adaptací obecného překladače na texty z oblasti cestovního ruchu. Vidíte, že výsledný text je krásně čitelný a téměř bez chyb.
Je zřejmé, že takto vytvořený speciální překladač dokáže překladatelům ušetřit spoustu času a zkrátit proces lokalizace textů do češtiny. Současně ale musíme zdůraznit, že samotná příprava vyladěného překladače trvá několik dní či týdnů a vyplatí se proto až při překladu většího množství textu, řádově stovek či tisíců normostran.
Jaro plné knih a cestování: 3 veletrhy, kde se můžeme v březnu potkat
Začátek jara je opravdu bohatý na skvělé akce pro všechny cestovatele, kde se můžeme vidět osobně a načerpat inspiraci. Zveme vás hned na 3 veletrhy a festivaly, kam se vydáme s našimi cestovatelskými průvodci.
Pozvánka: Knižní festival Ostrava 2026
Zastavte se za námi 20.–21. 2. v Ostravě na Černé louce! Ve stánku nakladatelství Lingea na vás budou čekat naše čerstvé novinky, osvědčené bestsellery i veletržní sleva na všechny tituly.
Konference pro lepší angličtinu: Meet. Share. Inspire.
Lingea je opět partnerem prestižní konference pro učitele angličtiny, která má motto Meet. Share. Inspire. Letos na ní představíme třeba novinky u online slovníků.
Kniha Brno 2025: Redaktor Martin Hromek představuje novinku Suroviny a moc
V neděli 2. listopadu od 15.00 hod. zveme na besedu s naším redaktorem Martinem Hromkem na veletrhu Kniha Brno. Představí vám skvělou podzimní novinku Suroviny a moc. Navštivte nás také na stánku č. 29 a využijte veletržní slevu na všechny knihy.
Pozvánka: Uvedení novinek z řady Mýty a legendy v Anthroposu
Srdečně vás zveme na slavnostní uvedení 2 nejnovějších titulů z řady Mýty a legendy: Dívka v krokodýlí kůži a Ozvěny bouře mečů. Už 15. listopadu od 15.00 hodin v brněnském Anthroposu s autorem Ondřejem Pivodou a ilustrátorem Vladimírem Rimbalou.
Pozvánka: 35. Podzimní knižní veletrh v Havlíčkově Brodě
Udělejte si výlet do Havlíčkova Brodu! Už tento týden (10. a 11. října) se tam v Kulturním domě Ostrov a v Krajské knihovně Vysočiny koná 35. ročník Podzimního knižního veletrhu.
Porto, Sevilla, Budapešť: Oblíbená řada průvodců Michelin Víkend se opět rozrůstá
Z tiskárny nám právě dorazilo Porto, které je zcela novou destinací. A také nová vydání Sevilly a Budapešti. Opětovně je dostupná také Madeira, která byla vyprodaná.
Chystáte se do Kodaně nebo na Sicílii? Objevte čerstvé novinky z edice Do kapsy
Ať už se chystáte prozkoumávat krásy severu, nebo vás láká třeba Itálie, průvodce z řady Do kapsy je vždy dobrou volbou. Hned 7 destinací právě vychází v novém aktualizovaném vydání.
Knižní festival Ostrava 2025
Objevte novinky a setkejte se s autory! Přijďte si užít svět knih, inspirativní besedy a autorská čtení na Výstavišti Černá louka (21.–22. března 2025). Zastavte se u našeho stánku a prolistujte si nejnovější knižní tituly!
Naplánujte svou příští cestu – inspirujte se na veletrhu!
Cestovatelský svátek je tady! Navštivte nás na veletrhu Holiday World & Region World v Praze a pořiďte průvodce na svoje cesty za výhodné ceny!
Poznejte země Vikingů, trolů a přírodních krás
Skandinávie vás nadchne nádhernou přírodou, všudypřítomnou pohodou, historickými památkami i moderní architekturou. Nabízí také nevšední možnosti relaxace. Přijeďte na sever Evropy a nechte se strhnout skandinávskou dobrou náladou.
Řecko, země mytologie, historie a přírodního bohatství
Řecko je zemí starověkých bohů a hrdinských legend. Je známé svou neuvěřitelnou historií, bohatou kulturou a nádhernými ostrovy, které rozkvétají ve Středozemním moři. Prohlédněte si naše tipy, kam letos v létě vyrazit.
První multimediální slovník češtiny
Na portálu Nechybujte.cz jsme zveřejnili aktualizovanou verzi výkladového slovníku češtiny – v současné době největší a nejaktuálnější zdroj informací o češtině online! K čemu takový slovník je?
Legendární hrdinové v komiksu
Nejnovější vlna komiksů přenáší čtenáře do časů dávno minulých a vdechuje život historickým osobnostem i postavám řecké mytologie. Na jejich stránkách se odvíjejí příběhy známých hrdinů, kteří utvářeli náš svět.
Odhalujeme fascinující vesmírné fenomény
Prozkoumejte VLNY: Atlas pohybu moře a KOMETY: Atlas velkých vlasatic. Nové artové publikace s půvabnými ilustracemi vás pohladí po duši a zároveň přimějí zamyslet se nad otázkami přírody, které lidstvo fascinují od nepaměti.
Duševní zdraví dětí
Sleva 20 % na knížky o duševním zdraví dětí pouze do 31. 3. 2024. Ukažte svým dětem, jak se vypořádat s novými výzvami, získat zdravou sebedůvěru nebo se starat o svou psychickou pohodu a vztahy s druhými.
Efektivní strojový překlad: Průvodce pro úspěch v B2B
S pomocí strojového překladu můžeme dnes ve světě obchodu snadno komunikovat napříč různými jazyky. Tento článek přináší praktické tipy, jak využít tento úžasný nástroj pro lepší spolupráci.
Slovníky Lingea – proč je používat a jak z nich vybírat?
Mají slovníky své místo i v době AI a strojového překladu?
Nejlepší destinace v Itálii pro vaši dovolenou
Zažijte Itálii jako nikdy předtím a odhalte její skryté poklady, bohatou historii i autentickou atmosféru. Připravili jsme pro vás tipy na průvodce, které vám doporučí nejzajímavější místa a poradí, jak si pobyt co nejvíce užít, i když do Itálie míříte opakovaně.
Strojové překlady a nové technologie
Jak nové technologie vylepšují kvalitu strojového překladu?
Slovník nebo překladač?
Patří budoucnost strojovému překladu a skončí slovníky na smetišti dějin?
Integrace terminologie do překladače
Jak zajistit, aby odborné termíny byly vždy přeloženy správně?
Zobrazuje se 1–3 z 22