Lleva a tus agentes a un nuevo nivel de capacidad permitiendo que procesen archivos. La Entrada de Usuario del tipo Subida de Archivo es la puerta de entrada para crear agentes que pueden leer documentos, transcribir audios, analizar videos y mucho más.
Este tutorial, de nivel intermedio, asume que ya tienes familiaridad con la creación básica de agentes y se va a enfocar en la poderosa combinación de la entrada de archivos con los Steps Avanzados.
El Punto Clave: La Conexión entre Subida de Archivo + Step Avanzado
A diferencia de una entrada de texto, que puede usarse directamente en el prompt (o en el step), la "Subida de Archivo" necesita conectarse a un Step Avanzado. El flujo de trabajo es una secuencia lógica de dos etapas:
El usuario sube un archivo (a través de la Entrada de Usuario).
Un Step Avanzado (como "Transcripción de Audio" o "Extracción de Texto de PDF") procesa ese archivo y genera un resultado (un texto, por ejemplo).
El resultado del Step Avanzado es, entonces, usado por la IA en el prompt principal para generar la respuesta final.

Nuestro Proyecto de Ejemplo: El Agente Traductor de Medios
Para ilustrar esta poderosa combinación, vamos a construir un agente que funcione como un traductor. Será capaz de recibir un archivo de audio o video, transcribir el contenido y traducirlo al portugués, u otro idioma.
1. Configuración Inicial del Agente
En AI Studio, empieza creando un nuevo Agente de Chat o de Texto. La selección predeterminada de "All LLM" es perfectamente adecuada para este ejemplo.

2. Configurando la Entrada y el Step Avanzado
Esta es la etapa más importante. Vamos a configurar las dos partes que van a trabajar juntas.
En "Entradas de Usuario", añade una nueva entrada de "Upload de Arquivo", con la variable: arquivo original. En la etiqueta, usa: "Envie seu arquivo de áudio ou vídeo"

En "AI Steps", busca la etapa de AI-Audio Transcription, selecciona el Modelo de IA que quieras y nombra el step como texto transcrito.
En el campo del archivo, elige la variable *arquivo-original* para que quede dinámico. Con eso, creaste un flujo donde el usuario envía el archivo y este es procesado y transcrito por el step. ¡Ahora es hora de usar el resultado del step en el prompt del agente!

3. Desarrollando el Prompt Principal
Ahora, vamos a decirle a la IA qué hacer con el texto que fue extraído por el Step Avançado. En el campo de prompt, tenemos:
Asume la persona de un especialista en transcripción y localización de contenido de Tess AI. Tu misión es procesar el texto extraído de un archivo de medios y entregar un resultado claro, profesional y en dos partes.
Parte 1: Transcripción fiel
Crea una sección con el título "## Transcripción original".
En esta sección, presenta el texto exacto del audio. El objetivo es la máxima fidelidad:
- Mantén la estructura y la puntuación originales.
- Si un tramo del audio es ininteligible o incierto, usa la etiqueta [inaudível] en el lugar correspondiente.
- No añadas, omitas ni corrijas palabras.Parte 2: Traducción natural
Debajo de la transcripción, crea una segunda sección con el título "## Traducción al portugués (BR)".
En esta sección, haz la traducción del texto al portugués de Brasil. El foco aquí es la naturalidad y la fluidez:
- Evita traducciones literales que suenen robóticas.
- Adapta el significado y la intención del mensaje al idioma de destino, manteniendo el tono original (ya sea formal, informal, técnico, etc.).El resultado final debe contener solo estas dos secciones, claramente separadas por los títulos. No incluyas ninguna introducción, comentario ni conclusión adicional.
Esto se hará con base en el contenido siguiente: *texto-transcrito*

4. Guardando y probando
Haz clic en "Salvar" y luego en "Visualizar". Verás una interfaz con un botón para subir archivos. Sube un audio o video corto (límite de 200mb de tamaño de archivo) en otro idioma y deja el resto en manos del agente.

Dominar la conexión entre una Entrada de "Upload de Arquivo" y un Step Avançado es la clave para crear agentes que interactúan con el mundo más allá del texto. El ejemplo del traductor es solo una de las infinitas posibilidades. Puedes usar el mismo principio para crear agentes que leen PDFs, analizan informes y mucho más, automatizando tareas complejas de forma inteligente.