Korektor překlepů

Korektor překlepů asi všichni znají a běžně používají. A protože v textovém editoru MS Word, tabulkovém procesoru Excel, prezentačním programu PowerPoint, sázecím program Adobe InDesign či programu Photoshop je integrováno řešení právě od firmy Lingea, možná jste už dlouho i vy spokojenými uživateli našich produktů.

Jazyková část

Struktura slovníku je založena na rozsáhlém formálním popisu morfologie a na detailním systému vzorů. Tento popis umožňuje z jednoho slovního základu (kmene) generovat až několik desítek odvozených tvarů, např. v českých slovech
milovat: milovat, miluji, miluješ, milujeme, miloval, milovala, milovali, milovaný, milovaná, milovaného, milování...
bratr: bratr, bratra, bratru, bratře, bratrem, bratři, bratry, bratrech, bratrova, bratrovo, bratrovy, bratrův...

Bohatou flexi mají především slovanské jazyky, nicméně i v románských mají slovesa množství různých tvarů, např. ve francouzštině
parler: parle, parles, parlons, parlez, parlent, parlais, parlait, parlions, parliez, parlaient, parlerai, parlé, parlant...

V ruštině je zase potřeba brát v úvahu zvratná zájmena, která se píší s některými slovesnými tvary dohromady:
жениться: женюсь, женишься, женится, женись, женилась, женились...
Podobně je tomu i ve španělštině, kde se navíc mohou se slovesem psát i osobní zájmena (poner->ponlo, decir->dime, escuchar->escúchala)

Extrémních rozměrů nabývají tvary v maďarštině, finštině a turečtině, kde se slova tvoří pomocí sufixů. Maďarština rozeznává kromě dvou čísel až 25 pádů a dva druhy přivlastňování (patřící danému objektu a patřící osobě):
ház: házak, házat, háznak, házzal, házig, házé, házéi, házaké, házakéi, házamé, házadé, házáé...

Všechna slova, která vytvářejí odvozené tvary shodným způsobem, jsou přiřazena ke stejnému vzoru. Každý slovník se tedy skládá ze dvou hlavních částí:
slovník vzorů: obsahuje lingvistickou informaci o tvoření tvarů, alternacích kořene a popis gramatických kategorií
slovník kmenů: obsahuje základní slovní zásobu kmenů většiny slov daného jazyka

Popis slov výše uvedeným způsobem je úplný v tom smyslu, že kromě slov s pravidelným odvozováním postihuje i slova:
s alternacemi kořene (např. české pes->psa, německé Bruder->Brüder)
s úplnou změnou kmene (např. anglické go->went, německé essen->isst, české hnát->žene)
nepravidelná slova (být, jíst, chtít)

Popis je natolik obecný, že umožňuje vytvořit slovník nejen pro češtinu a slovenštinu, ale taktéž pro další evropské jazyky. Vypořádá se např. se zvratnými slovesy v ruštině, opisným stupňováním v angličtině či polštině, staženými tvary ve francouzštině, odlučitelnými předponami v němčině, slučováním slovesných tvarů se zájmeny ve španělštině nebo bohatým vytvářením tvarů pomocí sufixů v ugrofinských jazycích.

Programové řešení

korektor překlepů

Díky efektivnímu algoritmu komprimace a celkovému generování slovníku je programové rozhraní jednoduché a snadno použitelné v libovolném softwarovém produktu.

Dostupné funkce

  • Ověření, zda je dané slovo ve slovníku. Tato funkce také kontroluje správnost použití velkého písmene na začátku vlastních jmen (Praha, Maria, Eisenhower...), velkých písmen ve zkratkách (USA, IBM) či ukončení zkratek tečkou (atd., apod.).
  • Nabídka oprav: vygeneruje všechna slova, ze kterých mohlo dané slovo vzniknout překlepem.
  • Obsluha uživatelských slovníků či speciálních slovníků pro automatickou záměnu chybných slov.
  • Nastavení parametrů, např. ignorování akronymů, jednopísmenných slov, slov s číslicemi apod.

V současnosti nabízíme kontrolu překlepů pro širokou škálu jazyků (viz tabulka). Implementována je rovněž na většině platforem (viz přehled).

Reference

Funkčnost a rychlost našeho řešení si můžete ověřit např. v programech Microsoft Office od verze Office 95 výše, v textových editorech (Corel WordPerfect), sázecích systémech (Adobe InDesign), OCR programech, redakčních systémech (MF Dnes) i např. programech firem Autodesk a Siemens.