?Qué es Alexa?
Alexa es un asistente de voz basado en la nube desarrollado por Amazon, que permite a los usuarios hacer preguntas o dar órdenes a los dispositivos Amazon Echo en lenguaje natural. Está disponible en más de 100 millones de dispositivos del vendedor y de varios fabricantes externos.
En la actualidad, el asistente se utiliza en toda una gama de aparatos electrónicos, desde altavoces y auriculares hasta ordenadores, televisores, vehículos y dispositivos inteligentes para el hogar y la oficina, y ofrece a los usuarios la posibilidad de interactuar con sus dispositivos de forma remota.
Alexa es uno de los asistentes virtuales más utilizados del mundo, con 71,6 millones de usuarios en 2022, solo por detrás de Google Assistant, con 81,5 millones, y Siri, con 77,6 millones.
?Cómo funciona Alexa?
Los usuarios con una cuenta de Amazon y un dispositivo habilitado para Alexa pueden conectar sus dispositivos a Internet. Una vez conectado y configurado, el dispositivo esperará a que el usuario pronuncie una palabra de activación, que pone al asistente virtual en modo de escucha.
En los dispositivos Amazon Echo, los usuarios pueden seleccionar la palabra de activación entre varias opciones, como Alexa, Amazon, Computer, Echo o Ziggy.
Una vez que el asistente virtual entra en modo de escucha, espera la entrada de lenguaje natural del usuario en forma de pregunta o comando.
Después de que el usuario formule una pregunta o emita una orden, Alexa utiliza el procesamiento del lenguaje natural (NLP) para procesar el habla del usuario, enviando el audio al Servicio de Voz Alexa, una solución de reconocimiento automático del habla (ASR) y comprensión del lenguaje natural (NLU), que convierte el audio en texto, para entender la petición del usuario.
A continuación, devuelve una respuesta al usuario, ya sea respondiendo a su pregunta o proporcionando el contenido o la acción solicitados.
Si la acción no se puede completar, se devuelve al usuario un mensaje del tipo “Lo siento, no puedo hacer eso”.
Ejemplos de comandos de Alexa
Alexa tiene la capacidad de responder a una amplia gama de comandos de voz, desde decir a los usuarios qué día es y qué tiempo hace fuera hasta abrir aplicaciones como Netflix y YouTube, reproducir películas e interactuar con dispositivos inteligentes del entorno local.
La cantidad de comandos admitidos depende de las aplicaciones y dispositivos a los que el usuario tenga acceso en su entorno doméstico o de oficina.
Aunque hay demasiadas variantes de comandos como para ofrecer una lista exhaustiva, aquí tienes algunos ejemplos de alto nivel para ilustrar las capacidades básicas del asistente virtual, formateados con la palabra de activación “Alexa” y a continuación la petición del usuario.
- Alexa, ?qué día es hoy?
- Alexa, ?qué tiempo hace hoy?
- Alexa, pon la alarma a las [hora].
- Alexa, llama a [nombre].
- Alexa, ?qué día es hoy?
- Alexa, pon [artista/canción/álbum].
- Alexa, mira [título/película/vídeo].
- Alexa, abre [aplicación].
- Alexa, pide [artículo de Amazon].
- Alexa, pide un Uber.
- Alexa, atenúa las luces un 25%.
- Alexa, cierra la puerta principal.
- Alexa, apaga/enciende [dispositivo].
- Alexa, cuéntame un chiste.
Alexa LLM
En septiembre de 2023, Amazon anunció el lanzamiento de un nuevo asistente de voz Alexa impulsado por el gran modelo de lenguaje Alexa (LLM). La organización pretende utilizar la IA generativa para inferir mejor el contexto de las peticiones en lenguaje natural de los usuarios y mejorar las capacidades conversacionales generales de Alexa.
El LLM también permitirá a los desarrolladores integrar contenidos y API para crear capacidades conversacionales adicionales en los dispositivos con Alexa.
Amazon también ha anunciado que está actualizando su sistema ASR con un nuevo modelo ASR de miles de millones de parámetros, que ha sido entrenado con expresiones y conversaciones más largas.
Polémica sobre la privacidad de los usuarios
En el pasado, Amazon ha recibido críticas por Alexa por grabar las voces de los usuarios y escuchar siempre sus actividades.
Aunque Amazon afirma que recopila datos de los usuarios para mejorar su rendimiento y adaptarse mejor a su voz y preferencias, los investigadores han descubierto que los datos recopilados de los altavoces inteligentes de los usuarios se han utilizado para enviarles publicidad.
Dicho esto, Amazon ofrece a los usuarios la posibilidad de eliminar las grabaciones de voz mediante la introducción de texto en lenguaje natural y les da la posibilidad de elegir cuánto tiempo quieren que se almacenen sus grabaciones de voz.