Штучний інтелект Google навчиться розпізнавати нерозбірливе мовлення

Google прагне зробити системи розпізнавання мови доступними для всіх, в тому числі тих, хто страждає від порушень дикції або погано говорить англійською. Модель навчання доповнили промовою хворих БАС і сеплами з сильним акцентом.

Люди з бічним аміотрофічним склерозом (БАС) часто мають проблеми з дикцією. Це ускладнює не тільки спілкування, а й використання систем розпізнавання мови, які, як правило, навчаються на даних здорових людей. Схожі труднощі відчувають люди, які говорять англійською із сильним акцентом.

Допомогти таким людям може сервіс Project Euphonia, який розробляють фахівці з Google. Щоб налаштувати стандартний алгоритм на роботу з «проблемними» користувачами, дослідники доповнили набори даних невеликою вибіркою, що репрезентує людей з БАС і акцентами. Так, вибірка для людей з БАС складалася з 36 годин аудіозаписів, отриманих від 67 пацієнтів. Вибірку з акцентами становили 20 часових записів.

За словами дослідників, цього було достатньо, щоб подолати дефіцит даних. Доповнені моделі розпізнавали мови людей з БАС і сильним акцентом на 62% і 35% відповідно.

Надалі в Google мають намір розширити тренувальні набори даних, щоб довести алгоритм до досконалості.

Джерело: rusjev.net