Коллеги из Пражской Медиашколы рассказывают, что такое голосовые технологии и чего от них ждать в будущем.
Согласно последним исследованиям (Canalys) за последний год мировой рынок “умных” колонок вырос почти в полтора раза. Россию эта тенденция тоже не обошла стороной — по сравнению с 2019 годом объем продаж устройств этого типа увеличился на 38%. Эксперты по всему миру прогнозируют, что 2021 год станет годом голосовых технологий, как впрочем и всё ближайшее десятилетие.
Голосовые технологии можно рассматривать через три составляющие:
* синтез речи — технология, которая дает возможность воспроизвести текст как можно более похожим естественным человеческим голосом.
* системы распознавания речи — позволяют преобразовывать человеческую речь в компьютерную форму.
* интерфейсная система — для совместного использования систем синтеза и распознавания речи нужно иметь программу, которая должна понимать, когда следует синтезировать, а когда распознавать полученную извне информацию — интерфейс.
Сейчас, самые используемые голосовые интерфейсы — это Alexa от Amazon, Siri от Apple, OK Google и Алиса от Яндекса (только в России и странах СНГ) — они стали частью умного дома, используются в смартфонах и ПК. Потенциальный спектр использования голосовых технологий шире — от персональных помощников до промышленных роботов.
В основе голосовых технологий лежит машинное обучение, и чем больше данных мы передаем ИИ, тем умнее он становится.
Зачем это нужно?
Скорость и доступность: дело в том, что в среднем человек может написать 40 слов в минуту, а произнести до 150. Голосовые технологии позволяют существенно улучшить качество жизни людей с инвалидностью и позволяют быстро получать проверенную информацию о том, что нужно делать в той или иной экстренной ситуации.
Автоматизация процессов: голосовые технологии могут освободить людей от тяжелой, низкооплачиваемой работы; так, например, по мнению экспертов в самое ближайшее время сотрудников call-центров заменят роботы. Но с тем, насколько это хорошие новости, можно поспорить.
Гигиена: пандемия заставила серьезно задуматься о необходимости внедрения бесконтактных голосовых технологий в общественных местах. Говорящие кофейные и билетные автоматы, управление лифтом с помощью голоса и многое другое — все это совсем скоро может стать нашей реальностью.
Общение: во время изоляции сотни тысяч людей скачали приложение Replika — которое умеет общаться на почти естественном языке, дружить и разработан, чтобы помогать справиться со стрессом. Как знать, может быть уже в самое ближайшее время фильм Спайка Джонза «Она» про роман между писателем и его операционной системой покажется нам такой уж утопией.
Оригинальный пост был опубликован на странице Пражской Медиашколы.