Aproveche la nueva traducción en vivo para Amazon Alexa

Obtenga el último contenido de Amazon cada semana

El gigante tecnológico lanzó recientemente una actualización que se sumará a las habilidades actuales de Alexa: la nueva Live Translation para Amazon Alexa.

Alexa ahora puede traducir entre portugués brasileño, italiano, hindi, francés, alemán, español e inglés en tiempo real. ¡Qué gran innovación!

La actualización de la traducción ayuda a los usuarios a pedirle a Alexa que traduzca un idioma, y ​​también aparece una pantalla de la transcripción en los dispositivos Echo.

Además, Alexa ahora puede identificar pausas naturales y saltos de oraciones en una conversación con mayor precisión.

La traducción nunca ha sido tan fácil. Esta tecnología de voz será un cambio total para las pequeñas empresas en los próximos años.

Puede considerar expandir su alcance a diferentes mercados.

Sus clientes ahora pueden solicitar información fácilmente sin tener que preocuparse por la interferencia del idioma.

Veamos cómo funciona la traducción en vivo para Amazon Alexa.

Traducción en vivo para Amazon Alexa 

traducción en vivo

Esta traducción en vivo permite que las personas que hablan en dos idiomas diferentes se comuniquen entre sí.

Alexa actúa como intérprete y traducir ambos lados de la conversación. 

Para empezar, la función funcionará con seis pares de idiomas (inglés y español, francés, alemán, italiano, portugués brasileño o hindi) en dispositivos Echo con la configuración regional configurada en inglés de EE. UU.

Los clientes pueden pedirle a Alexa que inicie una sesión de traducción para un par de idiomas.

Una vez que la sesión ha comenzado, los clientes pueden pronunciar frases u oraciones en cualquier idioma. Alexa identifica automáticamente un idioma y traduce cada lado de la conversación. 

La función Live Translation aprovecha varios sistemas de Amazon existentes, incluido el reconocimiento automático de voz de Alexa (ASR), Amazon Translate y Alexa's texto a voz .

ID de idioma

Alexa ejecuta dos ASR modelos en paralelo, junto con un modelo separado para la identificación del idioma durante una sesión de traducción. Independientemente del idioma que hable, pasa por ambos modelos ASR a la vez.

Sin embargo, solo se envía la salida de un modelo ASR al motor de traducción.

Para mantener aceptable la latencia de la solicitud de traducción, esta implementación paralela es necesaria, ya que esperar para comenzar el reconocimiento de voz hasta que el modelo de ID de idioma haya devuelto un resultado retrasaría la reproducción del audio traducido.

La salida ASR asociada se procesa posteriormente y se envía a Amazon Translate una vez que el sistema de identificación de idioma ha seleccionado un idioma.

La traducción se pasa al sistema de conversión de texto a voz de Alexa para su reproducción.

Además, Amazon descubrió que el modelo de ID de idioma funciona mejor cuando basa su decisión tanto en información acústica sobre la señal de voz como en las salidas de ambos modelos ASR.

En los casos de hablantes no nativos de un idioma, cuyo habla a menudo tiene propiedades acústicas consistentes independientemente del idioma que se hable, los datos de ASR son de gran ayuda.

Reconocimiento de voz

reconocimiento de voz

El modelo acústico convierte el audio en la unidad de habla más pequeña llamada fonemas.

El modelo de lenguaje codifica las probabilidades de cadenas particulares de palabras, lo que ayuda al sistema ASR a decidir entre traducciones o interpretaciones alternativas de la misma secuencia de fonemas.

Como la mayoría de los sistemas ASR existentes, los que se utilizan para la traducción en vivo de Alexa incluyen un modelo acústico y un modelo de lenguaje también.

Los sistemas ASR utilizados para Live Translation, como los modelos ASR existentes de Alexa, tienen dos tipos de modelos de lenguaje, a saber, el modelo de lenguaje tradicional y el modelo de lenguaje neuronal.

Un modelo de lenguaje tradicional, codifica probabilidades para cadenas de palabras relativamente cortas (típicamente alrededor de cuatro), y un modelo de lenguaje neuronal, que puede dar cuenta de dependencias de mayor alcance.

Los modelos de lenguaje de Live Translation fueron entrenados para manejar un discurso más conversacional que cubre una gama más amplia de temas que los modelos ASR existentes de Alexa.

Amazon utilizó la clasificación temporal conexionista (CTC) para entrenar los modelos acústicos.

Para hacer que el modelo acústico sea más potente, la empresa también mezcló ruido en el conjunto de entrenamiento, lo que permitió que el modelo se centrara en las características de la señal de entrada que varían menos en diferentes condiciones acústicas.

Trabajo de detalle

Hay una modificación de Alexa puntero final.

Esto indica que el cliente ha dejado de hablar y que Alexa necesita hacer un seguimiento. Esto también es necesario para adaptarse al habla conversacional.

El puntero final puede distinguir entre una pausa al final de una oración y una pausa en la mitad de la oración, lo que significa que el hablante puede continuar un poco más.

Para Live Translation, el puntero al final se modifica para tolerar pausas más largas al final de cada oración, ya que los hablantes que participan en conversaciones largas a menudo se toman un tiempo entre oraciones para formular sus pensamientos. 

Por último, el sistema de traducción en vivo se adapta a las disfluencias comunes. También ayuda a formatear la salida ASR.

El sistema de traducción automática neuronal de Amazon Translate fue diseñado para funcionar con entrada de texto. 

Actualmente, Amazon está explorando varios enfoques para mejorar aún más la función de traducción en vivo.

Uno de ellos es el aprendizaje semi-supervisado, en el que los modelos existentes de Alexa anotan datos no etiquetados.

Amazon utiliza los resultados de mayor confianza como ejemplos de capacitación adicionales para los modelos de ID de idioma y ASR específicos de traducción de Amazon.

Amazon también está trabajando para adaptar el motor de traducción automática neuronal a los datos del habla conversacional.

Genera traducciones que incorporan un contexto relevante como el tono de voz o traducciones formales versus informales.

Esto se hace para mejorar la fluidez de la traducción y su solidez a la entrada del lenguaje hablado.

Amazon busca formas y trabaja continuamente para mejorar la calidad de las traducciones en general y de las expresiones coloquiales e idiomáticas en particular.

Usar traducción en vivo

La tecnología detrás de Live Translate suena impresionante, y puede lea más sobre esto en la publicación de anuncio de Amazon.

Live Translate es una función impulsada por IA que puede reconocer varios idiomas a medida que se hablan y traducir para ambos hablantes.

También es similar al funciones de traducción disponibles de otros asistentes digitales

Live Translate es fácil de usar, pero hay algunas restricciones a tener en cuenta.

Tenga en cuenta que la función solo está disponible en dispositivos Echo en los EE. UU. Todo lo que tienen que hacer es configurar la ubicación de su dispositivo Echo y el idioma del sistema en “inglés de EE. UU.” Para usar Live Translate.

Los usuarios pueden  cambiar fácilmente ambos en la aplicación móvil Alexa si es necesario, pero esto no ocurre en todos los países, y al hacerlo, cambia el acento de habla de Alexa, junto con la hora, el clima y las alertas locales que recibe.

Live Translate también funciona en todos los dispositivos Echo.

Es solo que los usuarios de Echo Show obtienen una característica adicional: la pantalla de Echo Show.

Es una traducción en vivo para ambos hablantes en cada idioma para que pueda leer las oraciones más recientes.

Los altavoces Echo son actualmente los únicos dispositivos Alexa que admiten Live Translate.

Pasos para usar Live Translation para Amazon Alexa en un dispositivo Echo

Estos pasos son muy rápidos y puede obtener su traducción fácilmente. Todo lo que necesita hacer es lo siguiente:

1. Cuando esté listo para usar Live Translate, diga: "Alexa, traduce del inglés al [segundo idioma]". Otras variaciones de la frase deberían funcionar; solo asegúrate de decirle a Alexa qué idiomas traducir.

2. Mantenga su conversación normal. Alexa escuchará y traducirá según sea necesario. Para que su altavoz Echo escuche e interprete claramente a ambos altavoces, debe permanecer cerca.

3. Cuando termine la conversación, diga "Alexa, deténgase" para desactivar Live Translation.

Consideraciones Finales:

Traducción en vivo para Amazon Alexa es una nueva función que permite al usuario comprender otros idiomas fácilmente.

¡Ya sea que viaje a un país remoto o se ponga al día con parientes extranjeros para traducir un idioma a otro, nunca ha sido tan fácil!

Simplemente pídale a Alexa que inicie una sesión de traducción para dos idiomas (inglés y español, por ejemplo) y estará listo.

Puede comenzar a chatear, decir una frase en cualquier dialecto y Alexa identificará automáticamente el idioma y traducirá sus palabras.

Este programa actualmente funciona con seis pares de idiomas: inglés y español, francés, alemán, italiano, portugués de Brasil o hindi, y requiere un Dispositivo de eco con la configuración regional establecida en inglés de EE. UU.

Con suerte, Live Translate sacará a la luz otros dispositivos con tecnología de Alexa y también en otros países en el futuro, pero por ahora, podría facilitar las visitas a invitados internacionales.

Comparte la publicación:

¿Está buscando lanzar, crecer o obtener ganancias en Amazon?

¡Hable hoy con un miembro de nuestro equipo para ver cómo podemos ayudarlo!

Más publicaciones

Aprenda lo que necesita para convertirse en uno de los principales vendedores del 1%