Jak převést řeč na text

Dialog – když mobilní
aplikace pomáhá

Špatná komunikace způsobuje v životě jen problémy. Často je na vině lidská povaha, často odlišné kulturní pozadí. A někdy i fyzická bariéra. Jako u neslyšících. Právě pro ně vznikl Dialog, mobilní aplikace pro převod mluvené řeči na text.

Neslyším
dobře
Dialog
Mobile application
Android

Za lepší komunikaci

Aplikace Dialog vznikla primárně pro sluchově handicapované, jejichž poškození sluchu dosahuje hranice naprosté hluchoty. Těmto lidem už nepomáhá výkonné naslouchátko nebo jiná kompenzační pomůcka pro neslyšící a metoda odezírání ze rtů není vhodná vždy a pro každého.

Dialog, který převádí mluvenou řeč na text, jim nyní usnadňuje každodenní komunikaci v rodině, v obchodě, u lékaře nebo na úřadě. A taky umožňuje procvičování a rozvoj výslovnosti – neslyšící mluví na mobil a na displeji má okamžitou odezvu, zdali vyslovuje srozumitelně.

Ve znamení funkčnosti
a jednoduchosti

Tyto dvě kvality jsou pro mobilní aplikaci klíčové. Funkčnost jsme hodně řešili už ve fázi hledání dodavatele api / softwaru pro převod mluveného slova na text. Přestože je na trhu dostupných několik řešení, po zvážení všech technologických pro a proti jsme se rozhodli pro „voice speech recognition api“ od Google.

Google to vyhrál díky výrazné podpoře češtiny a dostatečně flexibilnímu javascriptovému jazyku. Naši vývojáři se tak mohli plně soustředit na programování mobilní aplikace pro jednotlivé operační systémy – Android, iOS, Windows Phone – a nemuseli řešit vlastní nedokonalosti api.

Neslyším
dobře

Tři sta třicet tři stříbrných křepelek přeletělo přes tři sta třicet tři stříbrných střech.

Požadavek jednoduchosti přišel na řadu při uvažování o funkcích aplikace a při designování její podoby.

Použití mobilní aplikace musí být snadné – uživatel musí porozumět tomu, co aplikace umí, i jejímu ovládání ihned po instalaci do svého mobilního telefonu. Proto jsme v této úvodní fázi „osekali“ veškeré uvažované funkce na tyto činnosti.

Nahrávání hlasové promluvy a její převod na text.

Možnost opravit chybně převedenou řeč.

Jednoduchost se musela projevit i v designu aplikace. A tak jsme v několika fázích ladili podobu uživatelského rozhraní Dialogu, rozložení jednotlivých prvků, jejich podobu, velikost i barevnost a téměř donekonečna si hráli s mikrotexty jednotlivých stavů. Výsledkem je přirozené a intuitivní ovládání.

Neslyším dobře

Prvotní sdělení musí být pro účastníka komunikace jasné: mám problém, můj chytrý telefon ho řeší, postupujte prosím takto. Díky kombinaci a uspořádání vizuálních i textových prvků jsme této pregnantnosti základní obrazovky nakonec dosáhli.

Obrazovka mobilní aplikace pro převod řeči na text

Lidský hlas je unikum

Lidský hlas je v přírodě unikum. Žádný nástroj ho zatím nezachytí a nepřevede dokonale. Proto je dobré mít možnost občasné chyby v převodu hlasu na text opravit. Opět jasně a jednoduše – poklepem na slovo a jeho editací na displeji mobilu anebo jeho novým hlasovým záznamem.

Obrazovka mobilní aplikace pro převod hlasu na text

Podpora aplikace ve světě smartphonů

Vyvinutím a otestováním aplikace to nekončí. Důležitá je také propagace a distribuce Dialogu, což prakticky znamená vytvořit jeho mikrostránky, nasadit mobilní aplikaci do app storů a kontinuálně pracovat na její marketingové podpoře.

Navštívit stránku

Mikrostránka na podporu Dialogu, mobilní aplikace pro neslyšící Mikrostránka na podporu Dialogu, mobilní aplikace pro neslyšící

Povedlo se? Kam a jak dál?

Z technického hlediska myslíme, že ano. O reálné úspěšnosti, tedy četnosti spokojených uživatelů, bude rozhodovat to, jak moc se nám podaří aplikaci rozšířit mezi neslyšící.

Pokud finance dovolí, v dalších fázích vývoje bychom rádi:

Dialog propojili s mikrofonem. To výrazně zvýší rozlišovací schopnost hlasového zařízení a umožní efektivní komunikaci i v rušném prostředí nebo při méně hlasité řeči.

Doplnili možnost dialogu dvou a více osob současně. Aplikace by měla fungovat obdobně jako chat, v němž se postupně zobrazují promluvy jednotlivých účastníků.

Udělali z Dialogu nástroj pro záznam, třídění a ukládání poznámek. Ne vždy je po ruce notebook, ne každému se dobře píše na displeji mobilu, řešením tak může být hlasový poznámkový blok.

Dvořákovský komplet České filharmonie

Česká filharmonie natočila nově všech 9 symfonií Antonína Dvořáka, a navíc 3 koncerty pro sólový nástroj a orchestr. Česká televize nahrávala živé koncerty a vznikl i dokument. A Perspectivo? To zajistilo propagaci projektu mezi online komunitou České filharmonie.

Podívejte se