Přehled projektů, na kterých se podílíme

Multilingvální asistent pro hledání, analýzu a zpracování informací a podporu rozhodování

Tento projekt je spolufinancován se státní podporou Technologické agentury ČR v rámci Programu TREND 3

Doba trvání projektu: 1. ledna 2021 - 30. dubna 2024
Partneři projektu: Lingea s.r.o., FIT VUT v Brně, MFF UK v Praze

Cílem projektu je vytvoření multilingválního asistenčního nástroje pro podporu rozhodování a přípravu informativních textů vysoké kvality. Asistent bude zpracovávat dostupné informace (lokální soubory, e-maily, indexované weby) v běžně užívaných formátech (HTML, TXT, PDF, DOCX, XLSX, ODT apod.) a podporovaných jazycích, budovat z nich znalostní bázi, odpovídat uživateli na dotazy nad ní a dohledávat podporu pro výsledky v indexovaných dokumentech. Nástroj bude schopen sumarizovat velká množství textu a automatizovaně získávat data z webu a tím výrazně šetřit čas uživatele. Bude obsahovat uživatelsky přístupné AI nástroje pro řešení konkrétních praktických problémů, např. z oblasti prodeje a marketingu.

Využití multimediálního výkladového slovníku pro moderní výuku češtiny

Tento projekt je spolufinancován se státní podporou Technologické agentury ČR v rámci Programu ÉTA 5

Doba trvání projektu: 1. dubna 2021 - 31. prosince 2023
Partneři projektu: Lingea s.r.o. a Západočeská univerzita v Plzni, Fakulta aplikovaných věd

Cílem projektu je zásadní kvalitativní a obsahová inovace Internetového slovníku současné češtiny Nechybujte.cz zapojením zvukových a obrazových informací a nových funkcionalit se zaměřením na interiorizaci jeho užívání studenty češtiny (i jako cizího jazyka) a širokou veřejností, včetně osob se smyslovým handicapem. Jde o zpracování zvukové stránky slovníku, ozvučení heslových slov a přípravu 2 syntetických hlasů k ozvučení výkladů a příkladů, a to v několika modalitách: pro běžné mluvčí, pro cizince učící se jazyk, pro nevidomé a slabozraké i pro nedoslýchavé. Dále projekt řeší zpracování slovotvorné a tematické klasifikace hesel, vytvoření klasifikované databáze a začlenění nového obrazového materiálu. Počítá též s vytvořením nástroje pro přípravu výukových materiálů pro žáky ZŠ a SŠ.

Nové metody zvýšení kvality, spolehlivosti a efektivity překladu textu a videa v prostředí CAT nástroje

Logo OP POdnikání a inovace pro konkurenceschopnost
Projekt je spolufinancován Evropskou unií v rámci Evropského fondu pro regionální rozvoj, Operační program Podnikání a inovace pro konkurenceschopnost.

Zkrácený název projektu: AMT4CAT
Doba trvání projektu: 1. března 2021 – 30. května 2023

Projekt se zabývá výzkumem a vývojem nových metod pro lokalizaci textových dokumentů a videonahrávek, které rozšíří dosavadní CAT a MT nástroje o nové možnosti a kontrolní mechanismy pro zajištění vyšší kvality a konzistence výstupu napříč všemi cílovými jazyky. Nové funkcionality a moduly budou integrovány do systému Tygeris a posílí jeho koncept all-in-one pro překladatele i firmy, kterým usnadní přípravu multijazyčného obsahu a lokalizaci dokumentů.

Metody hlubokého učení pro syntézu řeči jako zdroj inovací ve výuce jazyků

Zkrácený název projektu: TTS-TEACH2
Doba trvání projektu: 1. května 2020 – 31. prosince 2022
Partneři projektu: SpeechTech, s.r.o. a Lingea s.r.o.

Projekt se zabývá výzkumem a vývojem nových metod počítačové syntézy řeči využívajících metody hlubokého učení (tzv. deep learning) pro generování hlasu pomocí neuronových sítí. Syntéza řeči založená na těchto sítích umožní oproti aktuálně používané konkatenační syntéze snadnější, rozsáhlejší a přirozenější modelování lidského hlasu a umožní zásadní inovaci jazykové výuky. K aplikování metody a nového softwaru dojde na pět vybraných světových jazyků, dostupné bude na rozšířeném výukovém portálu.

Breakthrough techniques against cybercrime and terrorism

Projekt je spolufinancován Evropskou unií v rámci programu Horizon 2020.

Doba trvání projektu: 1. září 2020 – 31. leden 2023

Společnost LINGEA se v rámci evropského projektu AIDA podílí na boji proti kyberkriminalitě. Cílem tohoto projektu je analýza dat a vývoj nástrojů využívajících nejmodernější metody strojového učení, umělé inteligence i prediktivní a vizuální analytiky k potírání trestné činnosti. AIDA se zaměřuje na kyberkriminalitu a terorismus – výsledný systém bude integrovat nástroje pro efektivní těžbu a analýzu velkých dat specifických pro bezpečnostní složky. Společnost LINGEA byla k projektu přizvána jako specialista na strojový překlad mezi mnoha světovými jazyky včetně arabštiny či turečtiny.

Konsorcium zahrnuje 21 organizací z 11 zemí EU, mezi nimiž jsou např. Europol, University College Dublin, ministerstvo vnitra Španělska, ministerstvo spravedlnosti Portugalska a další významné státní a akademické instituce. Koordinátorem je společnost Engineering Ingegneria Informatica S.p.A. Společnost Lingea je jediným zástupcem východní Evropy v projektu. Vyzkoušejte kvalitu našich překladačů zde: https://translator.lingea.com/

Project is supported by the EU under the Horizon 2020 programme, coordinated by Mr. Ernesto La Mattina, Engineering Ingegneria Informatica S.p.A.
Running from September1st, 2020 to January 31st, 2023
Web page: https://www.project-aida.eu/

Využití syntézy řeči pro zlepšení výuky cizích jazyků

Logo OP POdnikání a inovace pro konkurenceschopnost
Projekt byl spolufinancován Evropskou unií v rámci Evropského fondu pro regionální rozvoj, Operační program Podnikání a inovace pro konkurenceschopnost.

Doba trvání projektu: 1. října 2017 – 15. září 2019
Partneři projektu: SpeechTech, s.r.o. a Lingea s.r.o.

Projekt se zabývá výzkumem využití počítačové syntézy řeči ke zkvalitnění výuky cizích jazyků a vývojem výukových systémů využívajících technologii syntézy řeči. Hlavním cílem bude integrovat tyto technologie do výukového portálu a zavést tak novou metodu interaktivní výuky vybraných cizích jazyků a nové typy cvičení založené na poslechu a procvičování správné výslovnosti. Služba bude cílena jak na koncové uživatele, tak na učitele cizích jazyků, kterým umožní přípravu vlastních cvičení.

Řešení projektu probíhalo podle plánu. Projekt byl ukončen k 15. 9. 2019.

Online služba pro vysoce kvalitní automatický překlad mezi slovanskými jazyky

Doba trvání projektu: 1. srpna 2017 – 31. ledna 2020

Cílem projektu je vytvořit online nástroj (software) pro rychlý automatický překlad mezi slovanskými jazyky, především češtinou, slovenštinou, polštinou a ruštinou. Výsledná služba bude dostupná všem zájemcům formou API a tedy ji budou moci využívat přímo z vlastních webových aplikací a online služeb. Součástí řešení budou i další korekturní a jiné podpůrné nástroje a webová aplikace pro zpřístupnění, aktivaci a sledování využití a zpoplatnění služby.

Řešení projektu probíhalo podle plánu. Projekt byl ukončen k 31. 1. 2020.

Health in my language

Lingea se účastní významného jazykového projektu, jehož koordinátorem je prestižní Edinburská univerzita. Projekt je podporován Evropskou unií v rámci programu Horizon 2020, jehož hlavním koordinátorem je Barry Haddow z výše jmenované skotské univerzity.

Doba trvání projektu: 1. února 2015 – 31. ledna 2018

Partneři projektu: Edinburská univerzita, Univerzita Karlova, Mnichovská univerzita, NHS 24, The Cochrane Collaboration a Lingea.
Webové stránky: www.himl.eu

Projekt Health in my language (dále HimL) si vytkl za cíl poskytovat veřejné zdravotnické informace v širším spektru jazyků. Chce toho dosáhnout za pomoci plně automatizovaného strojového překladu, který bude integrován do stávajících funkčních systémů provozovaných NHS 24 a The Cochrane Collaboration.

V Evropě je běžnou praxí, že informace medicínského charakteru jsou uživatelům zprostředkovány pomocí nejrůznějších webových služeb. Díky nim mohou občané snadno najít odpovědi na své otázky či dohledat příslušné služby v místě svého bydliště. Evropská populace je však značně mobilní a hovoří příliš mnoha jazyky, a právě proto dnes stále častěji zaznívá požadavek, aby byly veškeré poskytované informace k dispozici ve více jazycích. Abychom mohli tomuto požadavku dostát, musíme se spolehnout na automatizovaný strojový překlad; objem překladů do všech požadovaných jazyků je totiž takový, že jej není možné zvládnout manuálně. Cílem HimLu je využít nejnovějších pokroků v oblasti strojových překladů a vytvořit a následně uvést do praxe systém, který bude automaticky překládat informace medicínského charakteru, se speciálním důrazem na zachování významu. Zvláštní pozornost bude věnována adaptaci na doménu, překladům do jazyků s bohatou morfologií, managementu terminologie a strojovému překladu s využitím sémantických postupů.

Vše má vést k vytvoření spolehlivého, plně automatického a v praxi využitelného strojového překladače medicínských textů, který bude primárně testován na překladech z angličtiny do češtiny, polštiny, rumunštiny a němčiny. Veškeré inovace a vylepšení budou v rámci projektu HimL postupně začleňovány do systémů strojového překladu, výsledky budou pečlivě vyhodnocovány a budou procházet testováním ze strany uživatelů.

Project is supported by the EU under the Horizon 2020 programme, coordinated by Barry Haddow, University of Edinburgh, Scotland.
Running from February 1st, 2015 to January 31st, 2018.
Partners: University of Edinburgh, Charles University, Prague, Ludwig Maximilian University of Munich, NHS24, The Cochrane Collaboration and Lingea.
Web page: www.himl.eu

HimL aims to make public health information available in a wider variety of languages. We will do this using fully automatic machine translation, integrating it into the live systems run by NHS24 and The Cochrane Collaboration.

To an ever-increasing extent, web-based services are providing a frontline for healthcare information in Europe. They help citizens find answers to their questions and help them understand and find the local services they need. However, due to the number of languages spoken in Europe, and the mobility of its population, there is a high demand for these services to be available in many languages. In order to satisfy this demand, we need to rely on automatic translation, as it is infeasible to manually translate into all languages requested. The aim of HimL is to use recent advances in machine translation to create and deploy a system for the automatic translation of public health information, with a special focus on meaning preservation. In particular, we will include recent work on domain adaptation, translation into morphological rich languages, terminology management, and semantically enhanced machine translation to build reliable machine translation for the health domain. The aim will be to create usable, reliable, fully automatic translation of public health information, initially testing with translation from English into Czech, Polish, Romanian and German. In the HimL project we will iterate cycles of incorporating improvements into the MT systems, with careful evaluation and user acceptance testing.

Meeting assistant (MINT)

Příjemce: VUT Brno, Fakulta informačních technologií
Spolupříjemce: Lingea s.r.o., Phonexia s.r.o., Tovek s.r.o.
Řešitelé: doc. Dr. Ing. Jan Černocký, Ing. Ondřej Glembek, Ph.D, Mgr. Michal Kašpar, Ing. Sergij Černičko, Ing. Petr Schwartz, Ph.D. Ing. Miroslav Nečas, Ph.D.
Agentura: TA ČR, program: Alfa, 4. veřejná soutěž, kód: TA04011311, řešení projektu: říjen 2014 - prosinec 2017

Klíčová slova:
jednání; mezilidská komunikace; rozpoznávání řeči; strojový překlad; dolování dat; sumarizace; detekce slabých signálů; meeting asistent

Cílem projektu je výzkum a vývoj v oblasti zpracování audia během jednání mezi lidmi (schůze, jednání týmů, jednání se zákazníky, atd. ) vedoucí k vytvoření prototypu inteligentního asistenta pro pomoc během jednání (on-line), se zpracováním záznamu z jednání (off-line) a s následným systematickým uchováváním a sdílením záznamů jednání. Podrobnější informace na stránkách projektu http://mint-project.cz/

Řešení projektu probíhalo podle plánu, byl ukončen k 31. 12. 2017.
Hlavní principy a výsledky projektu zachycuje demonstační video.

Projekt TA04011311 "Meeting assistant" byl řešen s finanční podporou TA ČR.

Technologie zpracování řeči pro efektivní komunikaci člověk-počítač

Příjemce: VUT Brno, Fakulta informačních technologií
Spolupříjemce: Lingea s.r.o., Phonexia s.r.o., Optimsys s.r.o.
Řešitelé: doc. Dr. Ing. Jan Černocký, Mgr. Michal Kašpar, RNDr. Pavel Cenek, Ing. Pavel Matějka, Ing. Petr Schwartz,Ph.D.
Agentura: TA ČR, program: Alfa, kód: TA01011328, řešení projektu: 2011-2014

Klíčová slova:
rozpoznávání řeči, elektronické slovníky, obrana a bezpečnost, mobilní zařízení, dialogové systémy, CRM, eLearning

Anotace:
Cílem projektu je vyvinout pokročilé techniky pro rozpoznávání řeči a nasadit je v praktických aplikacích: vyhledávání v elektronickém slovníku na mobilních zařízeních, diktování překladů, v bezpečnosti a obraně, v dialogových systémech, systémech péče o zákazníky (CRM, helpdesk apod.) a v audiovizuálním přístupu k výukovým materiálům.

Řešení projektu probíhalo podle plánu. Projekt byl ukončen k 31. 12. 2014.

Projekt TA01011328 "Technologie zpracování řeči pro efektivní komunikaci člověk-počítač" byl řešen s finanční podporou TA ČR.

Multilingvální rozpoznávání a vyhledávání v řeči pro elektronické slovníky

Příjemce: Lingea s.r.o.
Spolupříjemce: VUT Brno, Fakulta informačních technologií
Řešitelé: Mgr. Michal Kašpar, doc. Dr. Ing. Jan Černocký
Agentura: MPO ČR, program: Tip, kód: FR-TI1/034, řešení projektu: 2009-2013

Klíčová slova:
multilingvalita, rozpoznávání řeči, detekce klíčových slov, elektronické slovníky

Anotace:
Projekt je zaměřen na výzkum, vývoj a ověření technologií, které umožní vytvářet systémy pro rozpoznávání řeči pouze s malým množstvím přepsaných trénovacích dat, bez fonetické a lingvistické expertízy. Tyto technologie by měly umožnit tvorbu rozpoznávačů i pro jazyky, pro které není dostatek trénovacích dat nebo nejsou dostupní experti pro použití pro klasické postupy. Vytvořené rozpoznávače pak plánujeme využít ve slovníkových aplikacích.
Projekt umožní efektivní použití hlasových technologií i pro jiné jazyky než angličtinu. Projektem se tak zhodnotí prostředky dlouhodobě vkládané do výzkumu a vývoje. Projekt dále podpoří významnou výzkumnou skupinu Speech@FIT a posílí uplatnění jejích výstupů v praxi.

Projekt byl rozdělen do následujících etap:
Etapa 1. Data pro trénování a testování
Etapa 2. UBM přístup a JFA prostor pro popis akustických parametrů
Etapa 3. Automatická tvorba výslovnostních slovníků
Etapa 4. Rozpoznávače řeči pro nové jazyky
Etapa 5. Implementace a integrace

Řešení projektu probíhalo podle plánu. Projekt byl ukončen k 31. 8. 2013.

Tento projekt byl realizován za finanční podpory z prostředků státního rozpočtu prostřednictvím Ministerstva průmyslu a obchodu.

Výzkum a vývoj korpusových a hlasových technologií v nové generaci elektronických slovníků

Příjemce: Lingea s.r.o.
Spolupříjemce: VUT Brno, Fakulta informačních technologií
Řešitelé: Mgr. Michal Kašpar, doc. Dr. Ing. Jan Černocký
Agentura: MPO ČR, program: Tandem, kód: FT-TA3/006, řešení projektu: 2006-2009

Klíčová slova:
elektronické slovníky, audio korpusy, rozpoznávání řeči, syntéza řeči, automatická segmentace, detekce klíčových slov, textové korpusy, značkování korpusů, dolování informací

Anotace:
Projekt je zaměřen na vývoj nové generace elektronických slovníků s podporou moderních technologií založených na velkých jazykových korpusech a uživatelském přístupu pomocí automatického rozpoznávání řeči. Korpusy byly dosud známy ve vědecké komunitě a pouze postupně pronikají do softwarových produktů distribuovaných přímo uživatelům, totéž platí o hlasových technologiích.

Projekt umožnil firmě Lingea posun v kvalitě uživatelských rozhraní slovníků na české i evropské úrovni. Díky tomuto projektu se zhodnotí prostředky dlouhodobě vkládané do výzkumu a vývoje. Na straně Fakulty informačních technologií VUT v Brně projekt podpořil významnou výzkumnou skupinu Speech@FIT a posílil uplatnění jejích výstupů v praxi.

Projekt byl rozdělen do následujících etap:
Etapa 1. Zpracování signálu
Etapa 2. Hodnocení výslovnosti
Etapa 3. Vyhledávání hlasem
Etapa 4. Textové a řečové korpusy
Etapa 5. Hlasový přístup ke korpusům
Etapa 6. Integrace

Řešení projektu probíhalo podle plánu. Projekt byl ukončen k 31. 12. 2009.

Tento projekt byl realizován za finanční podpory z prostředků státního rozpočtu prostřednictvím Ministerstva průmyslu a obchodu.