Google presenta Gemini 3.5 Live Translate para traducción instantánea de voz

 

Google ha dado a conocer el lanzamiento de Gemini 3.5 Live Translate, una innovadora tecnología de inteligencia artificial destinada a realizar traducciones de voz a voz en tiempo real, con una latencia mínima y una calidad notablemente superior a la de versiones anteriores.

Este nuevo sistema forma parte de la serie Gemini 3.5 y tiene como objetivo ofrecer una experiencia más natural en la traducción simultánea, facilitando conversaciones fluidas entre personas que hablan diferentes idiomas.

La herramienta permite la traducción en más de 70 idiomas. Según ha informado la compañía, Gemini 3.5 Live Translate es capaz de detectar automáticamente más de 70 idiomas y traducir diálogos en tiempo real con apenas unos segundos de retraso.

Una de las características más destacadas es que el sistema preserva aspectos fundamentales del habla original, tales como la entonación, el ritmo y el tono de voz, lo que resulta en traducciones más naturales y menos mecánicas.

Google afirma que este modelo puede seguir conversaciones cotidianas sin interrupciones significativas, acercándose cada vez más a una experiencia de interpretación simultánea.

La nueva tecnología comenzará a integrarse en varios productos del ecosistema de Google. Los desarrolladores ya tienen acceso a una versión preliminar a través de la API de Gemini Live y Google AI Studio, lo que les permitirá crear aplicaciones centradas en traducción conversacional.

Además, clientes empresariales seleccionados tendrán acceso a Gemini 3.5 Live Translate en Google Meet en las próximas semanas, antes de que se realice una expansión más amplia.

Asimismo, Google ha confirmado que esta funcionalidad estará disponible pronto en la aplicación Google Translate para dispositivos Android e iOS.

En cuanto a las opciones de uso en dispositivos móviles, la compañía ha ampliado las posibilidades. Anteriormente, las características avanzadas de traducción en vivo requerían auriculares compatibles o los Pixel Buds de Google. Con esta actualización, los usuarios podrán escuchar la traducción directamente desde su teléfono.

Para los dispositivos Android, se incorpora un nuevo «modo escucha», que permite acercar el teléfono al oído como si fuera una llamada telefónica, recibiendo la traducción de forma inmediata. Esta función podría ser especialmente útil en viajes, reuniones, visitas guiadas o situaciones donde no se disponga de auriculares.

Asimismo, Gemini 3.5 Live Translate trae mejoras en el procesamiento de audio, permitiendo filtrar automáticamente ruidos ambientales y mantener la calidad de la conversación incluso en entornos con mucho ruido de fondo, una limitación común en sistemas de traducción anteriores.

El sistema también gestiona automáticamente las conversaciones multilingües, eliminando la necesidad de que los usuarios configuren manualmente los idiomas involucrados.

En términos de seguridad, Google ha anunciado que todas las voces generadas por Gemini 3.5 Live Translate incorporarán marcas de agua digitales a través de la tecnología SynthID. Estas marcas se integran en la forma de onda del audio generado por inteligencia artificial, permitiendo identificar que la voz fue creada por un sistema automatizado.

La empresa ha señalado que no existe actualmente un método público para eliminar estas marcas, lo que busca aumentar la transparencia y disminuir posibles usos fraudulentos de voces sintéticas.

Google ha estado trabajando en la traducción automática durante más de una década, y la llegada de modelos generativos como Gemini ha permitido mejorar notablemente la calidad y naturalidad de los resultados. Con Gemini 3.5 Live Translate, la compañía busca convertir la traducción instantánea en una herramienta cotidiana para usuarios, empresas y desarrolladores, en un contexto donde la comunicación global y el uso de asistentes de inteligencia artificial continúan expandiéndose.

Con información de Montevideo Portal

RELACIONADAS

ULTIMAS