Vědci z Univerzity Karlovy připravují v Česku zatím unikátní projekt: dávají dohromady obří databázi českých slov, ze které se počítače budou „učit“ rozumět českému textu. A to tak dobře, aby dokázaly bez pomoci člověka vytvořit dokonalý překlad například životopisu nebo přečetly český text a dokázaly z něj udělat výtah toho nejdůležitějšího.

„V Česku je výzkum jazykových technologií na úplném začátku. Jediné, co počítače s češtinou jakžtakž umějí, je oprava spellingu v textových souborech, což je ta nejjednodušší technologie,“ říká Jan Hajič, profesor Ústavu formální a aplikované lingvistiky při Matematicko-fyzikální fakultě Univerzity Karlovy, který se svým týmem databázi českých slov připravuje.