Je to složitá ruční práce: pokud chce firma vědět, jak lidé hodnotí její výrobek nebo službu, musí si platit člověka, který sedí u internetu a prochází slovo od slova recenze v e-shopech nebo diskuse na sociálních sítích.

Vědci z Vysokého technického učení v Brně (VUT) teď ale přicházejí s projektem, který má vyhodnocování názorů zjednodušit. Letos začali pracovat na softwaru, který dokáže rozeznat emoce v českém textu.

Chtějí naučit počítač poznat, co se lidem líbí a co ne, jaké věci chválí, kritizují a co jim je lhostejné.

Na výzkumu pracují společně se soukromou firmou Westcom a software by měl být hotový do roku 2015. Stát na jeho vývoj přispěje více než 12 miliony korun, další více než tři miliony platí Westcom ze svého.

„Program, který by uměl poznat emoce ze slov, pro češtinu zatím neexistuje,“ říká člen výzkumného týmu Radim Burget z brněnského VUT.

„Budeme hledat automatické metody, které dokážou rozeznat, které slovo má jaký emoční význam. Jak přesně toho chceme dosáhnout, z taktických důvodů nemůžeme prozradit,“ dodává Burget.

Problém s ironií

Podobné programy, které dokážou z diskusí na internetu automaticky poznat emoční náboj, se běžně používají v zahraničí a jsou určené zejména pro angličtinu.

Tuzemské firmy přiznávají, že analýza textů o jejich produktech na Facebooku nebo v nejrůznějších diskusích je pro ně důležitá.

„Monitoring sociálních sítí využíváme. Nápad českých vědců je jistě pozoruhodný, nicméně autoři budou stát před nelehkým úkolem – vypořádat se s ironií a sarkasmem, které pisatelé s oblibou používají,“ říká mluvčí T-Mobile Jiří Janeček.

Na stejný problém upozorňuje i Rostislav Starý z agentury PR Konektor. „V češtině je mnohem složitější pochopit, kdo co jak myslel. Jedno slovo může mít spoustu různých významů a záleží velmi na tom, v jakém kontextu je zasazeno,“ podotýká Starý.

„Žádný trik, který by to dělal v češtině automaticky, není. Většinou to musí hodnotit nějaký analytik. Musí zjistit, v jakém kontextu slovo bylo použito a jaký byl přesně jeho význam,“ dodává Starý.

Vědci o potížích s dvojsmysly v češtině vědí a tvrdí, že s tím počítají. „Ano, v češtině tento problém skutečně je. Máme několik nápadů, jak jej vyřešit,“ vysvětluje Burget.

Programy jsou zatím nepřesné

I pro češtinu už existuje pár programů, které mají citové zabarvení slov určovat, jsou ale poměrně nepřesné. „Používáme program Yeseter. Umí vyhledat zmínky a určit jejich sentiment. Nicméně správnost se může pohybovat jen kolem 70 až 75 procent,“ říká Jan Páv z mediální agentury MEC.

„Automatizované řešení je pro nás v tuto chvíli zatím utopie. Vyhodnocování citového zabarvení slov děláme ručně,“ tvrdí Páv.

Ve světě využívají programy na vyhodnocování smyslu textu ve velkém hlavně technologické firmy, když chtějí vědět, co si lidé myslí o jejich výrobcích, a na základě toho uzpůsobí reklamní kampaň, nebo PR agentury, když chtějí znát názor lidí na nějakou značku.