Los colegas de la Prague Media School nos cuentan qué son las tecnologías de voz y qué podemos esperar de ellas en el futuro.
Según las últimas investigaciones (Canalys), el mercado mundial de altavoces inteligentes casi se ha duplicado en el último año. Rusia tampoco ha estado ajena de esta tendencia: las ventas de dispositivos de ese tipo han aumentado un 38% respecto a 2019. Expertos de todo el mundo predicen que 2021 será el año de las tecnologías de la voz, al igual que toda la próxima década.
Las tecnologías de la voz pueden estudiarse a través de tres componentes:
* Síntesis de voz: tecnología que permite reproducir un texto lo más parecido posible a una voz humana natural.
* Sistemas de reconocimiento del habla: permiten convertir el habla humana en un formato informático.
* Sistema de interfaz: para utilizar conjuntamente los sistemas de síntesis y reconocimiento del habla, es necesario contar con un programa interfaz que entienda cuándo sintetizar y cuándo reconocer la información recibida externamente.
En la actualidad, las interfaces de voz más utilizadas son Alexa de Amazon, Siri de Apple, OK Google y Alice de Yandex (sólo en Rusia y los países de la CEI). Ellas se han convertido en parte del hogar inteligente y se utilizan tanto en smartphones como en ordenadores. El abanico de usos potenciales de las tecnologías de voz es más amplio, desde los asistentes personales hasta los robots industriales.
Las tecnologías de voz se basan en el aprendizaje automático, y cuantos más datos le demos a la IA, más inteligente se volverá.
¿Para qué las necesitamos?
Rapidez y accesibilidad: una persona media puede escribir 40 palabras por minuto, pero puede hablar hasta 150. Las tecnologías de voz pueden mejorar considerablemente la calidad de vida de las personas con discapacidad y les permite recibir rápidamente información verificada sobre qué hacer en una situación de emergencia.
Automatización de procesos: las tecnologías de voz puede liberar a las personas de trabajos duros y mal pagos; por ejemplo, según los expertos, en un futuro muy cercano los robots sustituirán al personal de los centros de llamadas. Claro que es discutible hasta qué punto esto sea una buena noticia.
Higiene: La pandemia ha obligado a reflexionar seriamente sobre la necesidad de introducir las tecnologías de voz sin contacto humano en los lugares públicos. Las máquinas de café y de billetes que hablan, el control de los ascensores activado por voz y otras cosas útiles más podrían ser muy pronto parte de nuestra realidad.
Comunicación: durante el aislamiento, cientos de miles de personas descargaron la aplicación Replika, que sabe comunicarse en un lenguaje casi natural, entablar amistad y está diseñada para ayudar a sobrellevar el estrés. Quién sabe, tal vez en un futuro muy cercano la película de Spike Jonze «Her», sobre el romance entre un escritor y su sistema operativo, ya no parezca una utopía.
El post original se publicó en la página de la Prague Media School.