TECNOLOGIA

Creado para ayudar, no para reemplazar: Dentro de la IA en tiempo real de Intercall para intérpretes profesionales

Entre los intérpretes que confían en él, el veredicto es consistente: al final, algo se hace según su forma de trabajar. La premisa es simple. Interpretar como humanos y máquinas, no como máquinas, funciona mejor.

La interpretación es una de las tareas más difíciles que una persona puede realizar en tiempo real. El intérprete a menudo tiene que escuchar, comprender, reformular y hablar, a menudo con un acento desconocido o una serie de números que llegan más rápido de lo que uno puede escribir. Los investigadores describieron una "hipótesis de la cuerda floja": para la mayoría de las tareas, los intérpretes trabajan al límite de su capacidad mental y, a medida que esa carga aumenta, la precisión disminuye. La tensión también es física. La presión del tiempo aumenta el estrés y el ritmo cardíaco, y la calidad disminuye durante más de media hora, lo que hace que los intérpretes roten aproximadamente cada 30 minutos.

Esa presión ha aumentado a medida que el trabajo se ha movido en línea. La interpretación es una industria de 11.700 millones de dólares, estima Nimudzi, y una parte cada vez mayor de ella se realiza ahora de forma remota: a través de vídeo, a través de audio asincrónico, en reuniones híbridas que no existían hace cinco años. Los sistemas de subtítulos a los que pueden acceder los intérpretes nunca fueron diseñados para ellos. Intercall se creó para cerrar esa brecha.

Creado para intérpretes

Intercall es una plataforma de traducción y subtítulos en tiempo real con participación humana creada para una audiencia: intérpretes profesionales. Human-in-the-loop significa exactamente eso. La gente está a cargo, el software ayuda. Cuando el intérprete está trabajando, Intercall pone en pantalla todo lo que se dice como texto, en ambos idiomas, en el momento de hablar.

Su fundador, Bahodir Rajabov, empezó con algo que la mayoría de los productos pasan por alto. Un intérprete no necesita una transcripción ordenada después de la reunión; Necesitan la palabra adecuada en el momento, lo suficientemente rápido como para que no rompa su concentración. El nombre que no pudieron captar. Esa imagen desaparece muy rápidamente. Término técnico de un campo en el que no funcionan todos los días.

Rajabov comenzó a programar a la edad de 14 años en Bukhara, Uzbekistán, y luego se unió al equipo de IA generativa de IBM. Creó Intercall para resolver un problema que el resto del mercado estaba ignorando y fue el arquitecto clave de: captura de audio nativa, canal de transcripción de baja latencia, sistema de terminología y flujo de trabajo de escritorio multiplataforma. Los sistemas de subtítulos comunes disponibles para los intérpretes funcionaban entre tres y cinco segundos detrás del orador. Eso está bien para los subtítulos. Este es un problema real para un intérprete médico que transmite síntomas mientras habla, o en una sala de tribunal donde medio segundo puede cambiar el significado de una declaración.

Como él mismo lo expresa: "Nadie hizo nada para el intérprete. Son maestros en su oficio y trabajan con herramientas prestadas. Subtítulos creados para espectadores, aplicaciones de traducción diseñadas para viajeros. Sólo necesitan algo hecho para ellos."

como funciona

El punto de inflexión fue abandonar el navegador. Intercall se ejecuta como software nativo en la propia máquina del intérprete, instalado como Word o Zoom en lugar de abrirse como un sitio web. Escrito en C++, funciona directamente con el sistema operativo y recibe audio directamente de las convocatorias abiertas, ya sea Zoom, Microsoft Teams o Google Meet. Sin extensiones de navegador, sin robots de reuniones y sin pantalla compartida

Hace tres cosas. Transcribe la conversación a medida que ocurre, lo suficientemente rápido como para que el texto se mantenga al nivel del hablante sin retroceder. "Debería sentirse instantáneoDijo Rajabov.En el momento en que el texto se queda atrás del hablante, es inútil y los intérpretes simplemente lo apagan." Capta las partes que son fáciles de pasar por alto y más costosas de equivocarse, los sustantivos correctos y los términos especializados, y permite al intérprete cargar hasta 600 propios antes de una sesión: vocabulario de cardiología antes de una cita de cardiología, nombres de casos antes de una audiencia. Y en una llamada multilingüe cambia entre idiomas y dialectos, a través de docenas de ellos. El inglés del médico y el ruso del paciente, así como el prisionero, en una conversación, la forma en que realmente ocurren las llamadas interpretadas.

Para la mayoría de los intérpretes, esa ventana reemplaza un mosaico de herramientas que otras personas han desarrollado: subtítulos de reuniones, un bloc de notas, una pestaña de traducción abierta en un navegador. La diferencia se nota en el trabajo mismo. Menos solicitudes de repeticiones. Se transmiten pasajes largos y densos sin interrumpir el flujo de la conversación. Mucho menos que la frenética toma de notas que agota al intérprete al final de un turno, por lo que la energía que se dedica a capturar y retener detalles vuelve a la interpretación.

Intercall está diseñado para ayudar, no para hacerse cargo. No se lo explica al usuario. Revela lo que de otro modo sería pasado y lo devuelve, dejando al intérprete a cargo de esa parte que sólo una persona puede hacer: el significado y el juicio. Esa elección colocó a Intercall principalmente en una categoría de humanos involucrados que los analistas ahora rastrean, IA que apoya en lugar de reemplazar a los intérpretes profesionales durante el trabajo en vivo. Desde entonces, los grandes nombres han seguido el mismo camino. Bustlingo agregó una herramienta de productividad de inteligencia artificial en 2024, KUDO brindó soporte a su consola de interpretación en 2025 y los analistas de Slater y Nimudji ahora cubren el segmento.

Confidencialidad

Los intérpretes plantean la objeción obvia casi de inmediato: si se trata de IA, ¿almacena mi audio y mi formación en conversaciones privadas con mis clientes? La forma en que se construye la plataforma es la respuesta de la empresa, no la política de privacidad. Según Intercall, el audio, las transcripciones y las traducciones permanecen sólo en la memoria y desaparecen cuando finaliza la sesión; No se escribe nada en el servidor ni se utiliza nada para entrenar los modelos. Todo lo que crea un intérprete es suyo. Está encriptado, y las prácticas médicas reguladas por HIPAA y los reclamos judiciales se realizan por motivos de confidencialidad, donde una transcripción filtrada es una infracción, no una molestia.

Aceptación e impacto

Intercall existe desde hace más de un año y medio. Más de 3.000 intérpretes profesionales en 18 países la utilizan, y ahora se realizan miles de horas de interpretación en vivo a través de la plataforma cada mes. Lo que destaca es el alcance. El grupo más grande de usuarios se encuentra en la República Dominicana, con intérpretes pagos en los Estados Unidos, Polonia, Perú, Honduras, México, Canadá y más allá, muchos de ellos trabajando a través de proveedores de intérpretes, incluidos Propio Language Services, iCall International y otros. Lo utilizan en asignaciones en vivo en hospitales, juzgados y salas de conferencias. Su crecimiento se ha producido principalmente a través de la profesión: los intérpretes lo recomiendan a sus colegas y lo dicen en público.

El efecto que describen se reduce a dos palabras: eficiencia y precisión.

Eficacia, ya que la herramienta absorbe parte del trabajo que agota al intérprete, almacenando nombres, números y detalles en la memoria mientras sigue escuchando y hablando. Los intérpretes afirman trabajar más horas con mucha menos fatiga. Algunos describen el último cambio con energía encendida mientras tomaban notas frenéticas. Algunos dicen que los sacó del agotamiento que casi los expulsó de la profesión. En un caso en el que el límite del trabajo es el agotamiento mental más que la habilidad, es la diferencia entre una carrera sostenible y una salida temprana.

La precisión es la otra mitad. Todo lo que se dice en la llamada se transcribe y traduce en tiempo real, en ambos idiomas, frente al intérprete, por lo que las solicitudes repetidas se reducen rápidamente y los detalles más costosos se equivocan: nombres de medicamentos, dosis, números de casos, direcciones, dejan de deslizarse. En un hospital, esto significa que un paciente que no habla nada de inglés recibe exactamente lo que le receta el médico. En una sala del tribunal, esto significa ingresar el expediente de evidencia en su totalidad.

Un intérprete de Propio Language Services de Columbia describió haber trabajado 48 horas a la semana con notas en papel y una tabla de boogie durante más de cinco años: "Al final del día, a menudo me sentía mentalmente agotado dependiendo de la memoria y la toma de notas". Incluso con la herramienta de subtítulos genérica implementada, “todavía tenía que ingresar manualmente números de teléfono, direcciones, nombres y otros detalles importantes… la carga cognitiva siempre estuvo ahí."Entonces encontró el intercol: "Esto ha reducido significativamente mi carga de trabajo mental y me ha permitido concentrarme en lo más importante: explicar con precisión y atender eficazmente a mis clientes. No más malabarismos con blocs de notas, traductores y múltiples herramientas de referencia. Realmente no puedo imaginarme trabajando sin él."

Los practicantes independientes dicen lo mismo. En una reseña detallada, el intérprete Noorhan Atmani escribió que “Reduce la carga cognitiva innecesaria, nos ayuda a captar lo que de otro modo podríamos perder (nombres, números, etc.) y nos apoya cuando trabajamos en contextos exigentes o desconocidos."Es hora de limpiarlo"El intérprete no reemplaza (y nunca pretende hacerlo)." Otro dijo más claramente: "Es como trabajar con un copiloto. Todavía estoy volando. Ahora tengo un dispositivo mejor."

¿Qué viene después?

Intercall está construido e impulsado por un equipo eficiente y dedicado, y la empresa ahora se centra en escalar: llegar a más intérpretes y llevar la plataforma a agencias de interpretación y equipos empresariales. El trabajo de ingeniería sigue una línea similar, y la mayoría de los esfuerzos se topan con un problema persistente: mantener la precisión en intérpretes de audio ruidosos y de baja calidad a menudo tiene que funcionar.

Esa disciplina se ganó la confianza del campo. "Empezamos como asistente. Hemos demostrado nuestra precisión y nos hemos ganado esa confianza primero”. Dijo Rajabov. "No puedes saltarte esa etapa. Otros han cometido errores aquí."

El intérprete está en el centro del trabajo, escuchando, sopesando y traduciendo un idioma a otro en tiempo real. Intercall no lo acepta. Según la frase de Rajabov, se les da un segundo par de orejas.

Source link

Redacción - ACN

Somos un portal de noticias líder en la República Dominicana que se especializa en ofrecer una cobertura informativa integral. Desde eventos políticos y económicos hasta avances científicos y noticias de entretenimiento, este sitio web es tu fuente confiable para mantenerse al día con los acontecimientos más relevantes tanto a nivel nacional como internacional. Además de ofrecer informes actualizados, ACN también se destaca por sus análisis en profundidad y sus entrevistas exclusivas que proporcionan una comprensión más completa de las noticias.

Artículos Relacionados

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Volver arriba botón