AITranslations

Traducción en vivo con IA para escuchar en varios idiomas.

AITranslations es un proyecto privado para traducción casi en tiempo real basada en IA. No es una oferta comercial. El objetivo es que las personas puedan seguir el mismo evento en distintos idiomas — con alta calidad, opciones de privacidad y costes continuos controlables.

Acceso y salas

Todo ocurre dentro de una «sala». Una sala es el contexto compartido de un evento: se envía audio a la sala y las personas oyentes reciben la traducción en su idioma.

Las salas pueden ser públicas o estar protegidas por contraseña. El acceso de emisor (transmitir audio/vídeo y gestionar ajustes) está limitado a usuarios autorizados. El uso es solo por invitación o bajo solicitud.

Transparencia de costes (Trae tu propia clave API)

AITranslations sigue un enfoque de «Trae tu propia clave API»: la plataforma se conecta a tus propias cuentas con proveedores de IA. Esto mantiene bajo tu control la elección del proveedor y la facturación.

Los costes continuos dependen principalmente del modo elegido, del modelo y del número de idiomas de destino, y pueden gestionarse de forma deliberada.

Modularidad y privacidad

La plataforma es modular. Según tus necesidades, puedes usar modelos de alta gama para máxima claridad o elegir configuraciones orientadas a mayor privacidad (por ejemplo, proveedores alternativos o modelos autoalojables).

Según la configuración, se transmite audio y/o texto a proveedores externos de IA para su procesamiento. No hay seguimiento publicitario; se pueden usar mediciones operativas para mantener el servicio fiable.

Tres vías para la traducción en vivo

AITranslations puede procesar el habla de tres maneras. Las vías se diferencian en si se genera audio traducido directamente o si primero se crea texto.

1) Traducción directa de voz a voz (Speech-to-Speech, S2S)

Un modelo en tiempo real convierte el habla directamente en habla traducida. Este enfoque está pensado para una reproducción natural y poca demora.

2) Traducción del habla con salida de voz posterior (AST→TTS)

El habla se convierte primero en texto traducido en el idioma de destino. Después, un modelo de text-to-speech (TTS) genera la salida hablada.

3) Procesamiento basado en transcripción (STT/ASR → traducción → TTS)

Primero se transcribe el habla. Después, la transcripción se traduce y un modelo de text-to-speech (TTS) la genera como audio.

Calidad en uso en vivo

AITranslations funciona mejor cuando la señal de entrada es clara: un buen micrófono, suficiente cercanía al orador y un entorno silencioso mejoran notablemente la claridad y la calidad de la traducción.

Roles: oyentes y emisor

Las personas oyentes pueden unirse a una sala mediante enlace o código QR (e introducir una contraseña si es necesario). El rol de emisor requiere autorización para transmitir audio y gestionar los ajustes de la sala.

Trabajo en curso

AITranslations aún está en desarrollo activo. Algunas funciones pueden estar incompletas, cambiar sin previo aviso o no funcionar en todos los entornos por ahora.