El control por voz permite controlar un dispositivo sin necesidad de introducir datos manualmente. Las órdenes se transmiten por voz. Hoy en día, los asistentes de voz están especialmente extendidos. Originalmente, sin embargo, el control por voz tenía un propósito diferente.
La era de los ordenadores como dispositivos de trabajo cotidiano comenzó en la década de 1970. El teclado fue el primer dispositivo de entrada para transmitir órdenes. En la década de 1980, Apple y Microsoft cambiaron sus sistemas operativos por interfaces gráficas de usuario. Esto permitió la inclusión de un ratón como segundo dispositivo de entrada manual. Se excluyeron del uso del ordenador todas las personas que no podían utilizar las manos debido a limitaciones físicas. Microsoft fue la primera empresa en encontrar una solución viable a este problema en forma de control por voz.
Del reconocimiento del habla al control por voz
Desde la década de los 60, los investigadores han experimentado con diversas soluciones para que los ordenadores reconozcan el habla. Sin embargo, estos intentos quedaron en nada. Esto no cambió hasta la década de 1980. Los científicos descubrieron que los ordenadores podían identificar correctamente los homófonos mediante la comprobación del contexto. Los homófonos son palabras idénticas que tienen un significado diferente según el contexto; por ejemplo, "gracioso" en el sentido de "graciosamente gracioso" o "extraño". IBM desarrolló el primer sistema de reconocimiento de voz que podía entender 5.000 palabras.
En el Cebit 1991, la empresa presentó finalmente un software que incluso entendía entre 20.000 y 30.000 palabras del vocabulario alemán. Sin embargo, el ordenador de acompañamiento tuvo que instalarse en una sala insonorizada, ya que el ruido de fondo ordinario ya era demasiado para el software. IBM siguió siendo el líder del mercado en los años 90 y sacó al mercado el primer sistema de control por voz (todavía muy primitivo) con "Dragon NaturallySpeaking".
Alrededor del año 2000, Microsoft comenzó a ocuparse de este tema. Esto animó a IBM a lanzar todas sus soluciones correspondientes como código abierto en 2004 para frustrar la mejor solución de Microsoft. Pero el éxito esperado no se materializó: en 2007 se integró el primer control de voz real en Windows Vista, que permitía a las personas con discapacidades físicas utilizar algunas de las funciones del ordenador. Por ejemplo, pueden dictar textos.
La era de los smartphones: el asistente de voz sustituye al control por voz
En 2007, Apple también lanzó el primer smartphone moderno, el iPhone. El control por voz se integró rápidamente mediante actualizaciones de software en iOS. Sin embargo, esto seguía siendo relativamente sencillo: los usuarios podían, por ejemplo, consultar la hora. Esto sólo cambió con el lanzamiento del iPhone 4S: Con Siri vio la luz el primer asistente de voz inteligente en un smartphone. Siri permitió dictar mensajes o hacer que los leyeran en voz alta, realizar búsquedas en Internet y llamar a contactos. Con el tiempo, Siri se volvió más y más inteligente.
Google hizo lo propio en 2012 con Google Now como asistente para dispositivos Android. Desde 2016, se conoce como Google Assistant y se considera el mejor control por voz. Microsoft desarrolló Cortana para su sistema operativo para teléfonos inteligentes Windows Phone (utilizado principalmente en dispositivos Nokia), que más tarde llegó a Windows 10 en ordenadores normales. Ahora Siri también puede encontrarse en los ordenadores Mac. Otros fabricantes de smartphones también han desarrollado sus propios asistentes: La solución Bixby de Samsung es la más conocida.