¿Qué es un asistente de voz?

Un asistente de voz es un programa que realiza acciones mediante instrucciones habladas. Ejemplos populares son Siri, Cortana, Alexa, Google Assistant y muchos más. El uso de estas aplicaciones es especialmente popular en los smartphones.

El asistente de voz se integró por primera vez en la vida cotidiana principalmente a través del desarrollo de Siri. Apple introdujo este servicio con iOS 5 y el iPhone 4s. Entre los ejemplos de su uso se encuentran las consultas sobre el tiempo, el establecimiento de conexiones para llamadas telefónicas o el guardado de citas. Siri se convirtió rápidamente en un éxito. En la actualidad, el asistente de voz registra unos dos mil millones de peticiones a la semana.

Unir el habla con un ordenador no es un concepto nuevo. Para facilitar a las personas con discapacidad el uso de sistemas operativos como Windows, Microsoft ofreció un asistente de este tipo ya en Windows XP. Sin embargo, estos primeros intentos fracasaron en su momento debido al hardware y al software. Los dispositivos no eran capaces de procesar el lenguaje natural con suficiente comprensión. Hoy las cosas son diferentes: Todos los servicios mencionados al principio pueden entender muy bien el habla e implementar comandos incluso sin una pronunciación clara.

El habla natural como reto

Para establecer un manejo fluido del habla como alternativa a métodos de entrada como el ratón y el teclado o las pantallas táctiles, era necesaria una comprensión mucho mejor del habla. Hoy en día, ya no es necesario utilizar frases preformuladas o una estructura de oración específica. Un asistente de voz utiliza grandes capacidades de servidores que trabajan en segundo plano y el aprendizaje automático para completar el reconocimiento del habla con una precisión cada vez mayor. Esto también significa que un asistente de voz sólo está disponible cuando hay una conexión a Internet.

Áreas de aplicación de un asistente de voz

Las posibilidades resultan ser amplias y son interesantes tanto para los usuarios particulares como para el uso empresarial:

  • Un asistente de voz puede escribir correos electrónicos y enviarlos a las personas que están almacenadas en la agenda de contactos.

Configurar citas o editarlas es posible mediante la voz.

  • Los motores de búsqueda también pueden manejarse mediante la introducción verbal en el smartphone (u otros dispositivos).
    • La música, las películas y otros medios de entretenimiento pueden gestionarse mediante un asistente de voz.

La lista podría continuar indefinidamente. Los desarrolladores de aplicaciones también pueden programar un asistente de voz específicamente para una aplicación. Las APIs necesarias son proporcionadas por los respectivos desarrolladores de los asistentes. Por ejemplo, sería posible buscar películas de un determinado año con un determinado actor principal dentro de una aplicación de streaming de películas (mientras que sólo se llama a un motor de búsqueda fuera de la aplicación).


Deja un comentario