La capacidad de convertir audio y video en texto de manera rápida y precisa es una herramienta poderosa para muchos profesionales y creadores de contenido. Ya sea para documentar reuniones, transformar webinars en posts de blog, poner subtítulos a videos o analizar entrevistas, la transcripción ahorra tiempo y abre nuevas posibilidades para aprovechar el contenido
En este artículo te cuento los principales métodos para transcribir tus archivos de audio o video usando Tess.
La manera más directa de hacer una transcripción en Tess AI es usando la sección específica en AI Copilot. Esta función es ideal para quienes buscan simplicidad y rapidez, sin tener que configurar prompts complejos.
Cómo Acceder y Usar:
En el menú lateral izquierdo de la plataforma Tess AI, busca y haz clic en AI Copilot.
Dentro de las opciones de AI Copilot, elige la pestaña Transcripción.
La interfaz de transcripción está dividida en dos lados:
Lado Izquierdo: Campo para subir el archivo de audio o video.
Lado Derecho: Zona donde se mostrará el texto transcrito.
Haz clic en "Elegir archivo" en la sección izquierda y selecciona el archivo de audio o video desde tu computadora.
Formatos Aceptados: Tess soporta varios formatos, como MP3, MP4, MPEG, MPGA, M4A, entre otros. Puedes hacer clic en el ícono de información (una "i" circular) para ver la lista completa.
Límite de tamaño: El archivo no debe superar los 200 MB.
Después de subir el archivo, haz clic en el botón "Tess genera para mí".
Espera al procesamiento. El tiempo puede variar según el tamaño del archivo.
El texto transcrito aparecerá en la sección derecha de la pantalla.
Recursos adicionales en el área de transcripción:
Edición: Podés editar directamente el texto transcrito, corrigiendo palabras, agregando puntuación, o formateando con negrita, cursiva y subrayado.
Costo: La transcripción en esta área tiene un costo fijo de 5 créditos por ejecución, más un costo variable de 0.03 créditos por segundo de audio/video. El costo total de la generación se va a mostrar.
Opciones de salida:
Copiar: Copia todo el texto transcrito al portapapeles.
Descargar (TXT): Descarga la transcripción como un archivo de texto plano (.txt).
Ver en HTML: Te deja ver el código HTML de la transcripción.
Eliminar: Borra la transcripción generada.
Consejo: Siempre revisá el formato y el tamaño de tu archivo antes de subirlo para asegurarte de que sea compatible.
Otra manera versátil de transcribir archivos es usando la función de chat de AI Copilot, junto con la Base de Conocimientos. Con este método no solo podés transcribir, sino también interactuar con el contenido del audio, pidiendo resúmenes, análisis o respuestas a preguntas específicas sobre el archivo.
Cómo acceder y usar:
En el menú lateral, entra a AI Copilot y selecciona la opción Para Conversa.
En la interfaz del chat, haz clic en el ícono de adjuntar (normalmente un clip) que está cerca de la caja donde escribes.
Selecciona "Adicionar base de conhecimento".
En la ventana que aparece, elige "Áudio" como el tipo de ítem a agregar.
Haz clic en "Escolher arquivo" y elige el archivo de audio desde tu computador (límite de 200 MB).
Configuraciones de la Transcripción:
Modelo de Transcrição: Elige el motor de transcripción que quieras:
Deepgram: Conocido por su rapidez.
AssemblyAI: Enfocado en mejor calidad.
OpenAI: Ofrece un buen equilibrio entre velocidad y calidad.
Rev.ai: Ideal para transcripciones que necesitan timestamping (marca de tiempo para cada intervención).
Linguagem: Selecciona el idioma del audio (ej: Portugués).
Context Mode (Modo de Contexto):
RAG: Recomendado para archivos grandes. La IA divide el archivo en partes y analiza solo lo necesario para responder lo que pidas.
Deep Learning: Recomendado para archivos pequeños. La IA analiza todo el contenido.
Haz clic en "Salvar". El archivo será procesado y añadido a tu base de conocimiento en la sesión actual del chat.
Ahora puedes interactuar con el audio. Para obtener la transcripción completa, escribe un comando como: "Faça a transcrição do arquivo em anexo"
o "Transcreva o áudio que enviei"
.
Además de la transcripción, puedes pedir resúmenes, identificar puntos clave, etc. Ejemplo: "Faça um resumo em tópicos sobre o arquivo anexo"
.
Tip: Este método es genial cuando necesitas algo más que solo el texto bruto, permitiendo un análisis más profundo e interactivo del contenido de tu audio.
Para usuarios que necesitan integrar la transcripción en flujos de trabajo más complejos o quieren crear IAs especializadas en analizar contenidos de audio, AI Studio permite la creación de agentes personalizados. (Esta función está disponible para usuarios de los planes Individual o Business).
Cómo Crear un Agente para Transcripción:
Accede al AI Studio en el menú lateral.
Haz clic en "Agregar nuevo agente".
Configuración inicial del agente:
Tipo de aplicación de IA: Selecciona "Chat" (o "Texto", dependiendo de tu objetivo final).
Modelo de IA: Puedes elegir un modelo específico (ej: GPT-4o mini) o dejar "All LLM Models" para que el usuario final elija.
Prompt: Define la persona, objetivo y reglas de tu agente. Ejemplo para un agente que analiza clases:
Persona: Você é um especialista em pedagogia e análise de conteúdo educacional.
Objetivo: Sua função é transcrever a aula fornecida e, em seguida, fornecer um resumo dos principais tópicos e três sugestões de melhoria para o apresentador.
Reglas: Seja claro, conciso e forneça feedback construtivo.
Entrada del Usuario (Subida de la clase):
Haz clic en "Agregar una entrada de usuario" debajo del prompt del sistema.
Tipo de entrada: Selecciona "Subir archivo".
Nombre de la entrada: Ponle un nombre descriptivo, como gravação da aula
.
Etapa de transcripción (AI Step):
Haz clic en "Agregar un AI step".
Categoría del step: Selecciona "AI Audio Transcription".
Tipo de etapa: Elige el modelo de transcripción (ej: Deepgram Audio Transcription
).
Nombre de la etapa: Ponle un nombre, como transcricao da aula
.
Media File: Haz clic en el ícono de enlace y selecciona la variable creada antes de la entrada de usuario (ej: **gravação-da-aula**
). Así aseguras que el archivo que subió el usuario se va a usar para transcripción.
Idioma: Define el idioma del audio.
Integrar la transcripción al Prompt principal:
Vuelve al Prompt de sistema del agente.
En el lugar donde quieres que aparezca la transcripción para analizar, inserta la variable del output del AI Step. Ejemplo: Sua função é analisar a aula transcrita a seguir: **class-transcript** e, em seguida, ...
Guardar y visualizar:
Ponle un nombre a tu agente y guárdalo.
Haz clic en "Visualizar" para probar. Podrás subir el archivo de audio, y el agente seguirá las instrucciones del prompt, usando la transcripción generada internamente.
Tip: Crear agentes es súper útil para automatizar tareas repetitivas y hacer soluciones de IA a la medida de lo que necesites para analizar audio.
Calidad de Audio: Cuanto mejor sea la calidad del audio original (menos ruido de fondo, personas hablando claro), más precisa será la transcripción.
Límite de Archivo: Recuerda que el límite es 200 MB por archivo en cualquier transcripción en Tess AI.
Formatos: Confirma que tu formato de archivo esté soportado antes de intentar subirlo.
Marcado de Tiempos: Si necesitas saber el momento exacto de cada intervención, usa el modelo Rev.ai en la transcripción desde el chat (Base de Conocimiento).
Varios Hablantes: Si hay varios hablantes en el audio, la claridad de la grabación es todavía más importante. Algunos modelos pueden batallar más si hay voces cruzadas.
Tess AI ofrece un conjunto robusto y flexible de herramientas para transcribir audio y video, cubriendo desde necesidades simples y directas hasta flujos de trabajo automatizados y complejos. Al dominar el área de Transcripción del AI Copilot, la transcripción por chat con la Base de Conocimiento y la creación de agentes en AI Studio, vas a poder transformar tu contenido de audio y video en texto de forma eficiente, optimizando tu tiempo y sacando el máximo provecho de tus grabaciones.