Health in my language

Lingea se účastní významného jazykového projektu, jehož koordinátorem je prestižní Edinburská univerzita. Projekt je podporován Evropskou unií v rámci programu Horizon 2020, jehož hlavním koordinátorem je Barry Haddow z výše jmenované skotské univerzity.

Doba trvání projektu: 1. února 2015 – 31. ledna 2018

Partneři projektu: Edinburská univerzita, Univerzita Karlova, Mnichovská univerzita, NHS 24, The Cochrane Collaboration a Lingea. Webové stránky: www.himl.eu

Projekt Health in my language (dále HimL) si vytkl za cíl poskytovat veřejné zdravotnické informace v širším spektru jazyků. Chce toho dosáhnout za pomoci plně automatizovaného strojového překladu, který bude integrován do stávajících funkčních systémů provozovaných NHS 24 a The Cochrane Collaboration.

V Evropě je běžnou praxí, že informace medicínského charakteru jsou uživatelům zprostředkovány pomocí nejrůznějších webových služeb. Díky nim mohou občané snadno najít odpovědi na své otázky či dohledat příslušné služby v místě svého bydliště. Evropská populace je však značně mobilní a hovoří příliš mnoha jazyky, a právě proto dnes stále častěji zaznívá požadavek, aby byly veškeré poskytované informace k dispozici ve více jazycích. Abychom mohli tomuto požadavku dostát, musíme se spolehnout na automatizovaný strojový překlad; objem překladů do všech požadovaných jazyků je totiž takový, že jej není možné zvládnout manuálně. Cílem HimLu je využít nejnovějších pokroků v oblasti strojových překladů a vytvořit a následně uvést do praxe systém, který bude automaticky překládat informace medicínského charakteru, se speciálním důrazem na zachování významu. Zvláštní pozornost bude věnována adaptaci na doménu, překladům do jazyků s bohatou morfologií, managementu terminologie a strojovému překladu s využitím sémantických postupů.

Vše má vést k vytvoření spolehlivého, plně automatického a v praxi využitelného strojového překladače medicínských textů, který bude primárně testován na překladech z angličtiny do češtiny, polštiny, rumunštiny a němčiny. Veškeré inovace a vylepšení budou v rámci projektu HimL postupně začleňovány do systémů strojového překladu, výsledky budou pečlivě vyhodnocovány a budou procházet testováním ze strany uživatelů.

Project is supported by the EU under the Horizon 2020 programme, coordinated by Barry Haddow, University of Edinburgh, Scotland.
Running from February 1st, 2015 to January 31st, 2018.
Partners:  University of EdinburghCharles University, PragueLudwig Maximilian University of MunichNHS24The Cochrane Collaboration and Lingea.
Web page: www.himl.eu

HimL aims to make public health information available in a wider variety of languages. We will do this using fully automatic machine translation, integrating it into the live systems run by NHS24 and The Cochrane Collaboration.

To an ever-increasing extent, web-based services are providing a frontline for healthcare information in Europe. They help citizens find answers to their questions and help them understand and find the local services they need. However, due to the number of languages spoken in Europe, and the mobility of its population, there is a high demand for these services to be available in many languages. In order to satisfy this demand, we need to rely on automatic translation, as it is infeasible to manually translate into all languages requested. The aim of HimL is to use recent advances in machine translation to create and deploy a system for the automatic translation of public health information, with a special focus on meaning preservation. In particular, we will include recent work on domain adaptation, translation into morphological rich languages, terminology management, and semantically enhanced machine translation to build reliable machine translation for the health domain. The aim will be to create usable, reliable, fully automatic translation of public health information, initially testing with translation from English into Czech, Polish, Romanian and German. In the HimL project we will iterate cycles of incorporating improvements into the MT systems, with careful evaluation and user acceptance testing.

Meeting assistant (MINT)

Příjemce: VUT Brno, Fakulta informačních technologií
Spolupříjemce: Lingea s.r.o., Phonexia s.r.o., Tovek s.r.o.
Řešitelé: doc. Dr. Ing. Jan Černocký, Ing. Ondřej Glembek, Ph.D, Mgr. Michal Kašpar, Ing. Sergij Černičko, Ing. Petr Schwartz, Ph.D. Ing. Miroslav Nečas, Ph.D.
Agentura:  TA ČR, program: Alfa, 4. veřejná soutěž, kód: TA04011311, řešení projektu: říjen 2014 - prosinec 2017

Klíčová slova: 
jednání; mezilidská komunikace; rozpoznávání řeči; strojový překlad; dolování dat; sumarizace; detekce slabých signálů; meeting asistent

Cílem projektu je výzkum a vývoj v oblasti zpracování audia během jednání mezi lidmi (schůze, jednání týmů, jednání se zákazníky, atd. ) vedoucí k vytvoření prototypu inteligentního asistenta pro pomoc během jednání (on-line), se zpracováním záznamu z jednání (off-line) a s následným systematickým uchováváním a sdílením záznamů jednání. Podrobnější informace na stránách projektu http://mint-project.cz/

Projekt TA04011311 "Meeting assistant" je řešen s finanční podporou TA ČR.

Logo TA ČR

Technologie zpracování řeči pro efektivní komunikaci člověk-počítač

Příjemce: VUT Brno, Fakulta informačních technologií
Spolupříjemce: Lingea s.r.o., Phonexia s.r.o., Optimsys s.r.o.
Řešitelé: doc. Dr. Ing. Jan Černocký, Mgr. Michal Kašpar, RNDr. Pavel Cenek, Ing. Pavel Matějka, Ing. Petr Schwartz,Ph.D.
Agentura:  TA ČR, program: Alfa, kód: TA01011328, řešení projektu: 2011-2014

Klíčová slova:
rozpoznávání řeči, elektronické slovníky, obrana a bezpečnost, mobilní zařízení, dialogové systémy, CRM, eLearning

Anotace:
Cílem projektu je vyvinout pokročilé techniky pro rozpoznávání řeči a nasadit je v praktických aplikacích: vyhledávání v elektronickém slovníku na mobilních zařízeních, diktování překladů, v bezpečnosti a obraně, v dialogových systémech, systémech péče o zákazníky (CRM, helpdesk apod.) a v audiovizuálním přístupu k výukovým materiálům.

Řešení projektu probíhalo podle plánu. Projekt byl ukončen k 31. 12. 2014.

Projekt TA01011328 "Technologie zpracování řeči pro efektivní komunikaci člověk-počítač" je řešen s finanční podporou TA ČR.

Logo TA ČR


Multilingvální rozpoznávání a vyhledávání v řeči pro elektronické slovníky

Příjemce:  Lingea s.r.o.
Spolupříjemce:  VUT Brno, Fakulta informačních technologií
Řešitelé:  Mgr. Michal Kašpar, doc. Dr. Ing. Jan Černocký
Agentura: MPO ČR, program: Tip, kód:  FR-TI1/034, řešení projektu:  2009-2013

Klíčová slova:
multilingvalita, rozpoznávání řeči, detekce klíčových slov, elektronické slovníky

Anotace:
Projekt je zaměřen na výzkum, vývoj a ověření technologií, které umožní vytvářet systémy pro rozpoznávání řeči pouze s malým množstvím přepsaných trénovacích dat, bez fonetické a lingvistické expertízy. Tyto technologie by měly umožnit tvorbu rozpoznávačů i pro jazyky, pro které není dostatek trénovacích dat nebo nejsou dostupní experti pro použití pro klasické postupy. Vytvořené rozpoznávače pak plánujeme využít ve slovníkových aplikacích.
Projekt umožní efektivní použití hlasových technologií i pro jiné jazyky než angličtinu. Projektem se tak zhodnotí prostředky dlouhodobě vkládané do výzkumu a vývoje. Projekt dále podpoří významnou výzkumnou skupinu Speech@FIT a posílí uplatnění jejích výstupů v praxi.

Projekt byl rozdělen do následujících etap:
Etapa 1. Data pro trénování a testování
Etapa 2. UBM přístup a JFA prostor pro popis akustických parametrů
Etapa 3. Automatická tvorba výslovnostních slovníků
Etapa 4. Rozpoznávače řeči pro nové jazyky
Etapa 5. Implementace a integrace

Řešení projektu probíhalo podle plánu. Projekt byl ukončen k 31. 8. 2013.

Tento projekt je realizován za finanční podpory z prostředků státního rozpočtu prostřednictvím Ministerstva průmyslu a obchodu.
logo

 

Výzkum a vývoj korpusových a hlasových technologií v nové generaci elektronických slovníků

Příjemce:             Lingea s.r.o.
Spolupříjemce:    VUT Brno, Fakulta informačních technologií
Řešitelé:      Mgr. Michal Kašpar,  doc. Dr. Ing. Jan Černocký
Agentura:    MPO ČR, program: Tandem, kód:  FT-TA3/006, řešení projektu:    2006-2009

Klíčová slova:
elektronické slovníky, audio korpusy, rozpoznávání řeči, syntéza řeči, automatická segmentace, detekce klíčových slov, textové korpusy, značkování korpusů, dolování informací

Anotace:
Projekt je zaměřen na vývoj nové generace elektronických slovníků s podporou moderních technologií založených na velkých jazykových korpusech a uživatelském přístupu pomocí automatického rozpoznávání řeči. Korpusy byly dosud známy ve vědecké komunitě a pouze postupně pronikají do softwarových produktů distribuovaných přímo uživatelům, totéž platí o hlasových technologiích.

Projekt umožnil firmě Lingea posun v kvalitě uživatelských rozhraní slovníků na české i evropské úrovni. Díky tomuto projektu se zhodnotí prostředky dlouhodobě vkládané do výzkumu a vývoje. Na straně Fakulty informačních technologií VUT v Brně projekt podpořil významnou výzkumnou skupinu Speech@FIT a posílil uplatnění jejích výstupů v praxi.

Projekt byl rozdělen do následujících etap:
Etapa 1. Zpracování signálu
Etapa 2. Hodnocení výslovnosti
Etapa 3. Vyhledávání hlasem
Etapa 4. Textové a řečové korpusy
Etapa 5. Hlasový přístup ke korpusům
Etapa 6. Integrace

Řešení projektu probíhalo podle plánu. Projekt byl ukončen k 31. 12. 2009.

 

Tandem - Fulltextové hledání v integrovaném korpusu
Lexicon 5 Platinum - fulltextové hledání v integrovaném korpusu

 

Tandem - Srovnání výslovnosti
Příklady srovnání uživatelské výslovnosti s referenční



Tento projekt je realizován za finanční podpory z prostředků státního rozpočtu prostřednictvím Ministerstva průmyslu a obchodu.