A transcrição manual de áudios é um processo demorado, pouco escalável e que muitas vezes impede o aproveitamento de informações valiosas contidas em gravações de reuniões, aulas, entrevistas ou vídeos. A Tess AI resolve esse desafio com os AI Steps de Transcrição de Áudio, uma funcionalidade poderosa que permite automatizar todo o processo, transformando qualquer arquivo de áudio em texto de forma rápida e precisa.
Este artigo guiará você, passo a passo, na criação de um agente de IA personalizado no AI Studio, capaz de receber um arquivo de áudio, transcrevê-lo e até mesmo realizar ações subsequentes, como criar resumos ou analisar o conteúdo.
Antes de começarmos, é importante entender o conceito de AI Steps. Pense neles como etapas ou blocos de construção de inteligência artificial que você pode adicionar ao seu agente. Cada step é projetado para executar uma tarefa específica, como transcrever um áudio, gerar uma imagem, analisar dados de uma planilha ou integrar-se a outros aplicativos. Ao combinar esses steps, você cria fluxos de trabalho automatizados e inteligentes, adaptados às suas necessidades.
Vamos construir um agente de exemplo que transcreve a gravação de uma aula e gera um resumo do conteúdo.
Passo 1: Acessando o AI Studio
O AI Studio é o ambiente onde você cria e personaliza seus agentes de IA.
No menu lateral esquerdo da plataforma Tess AI, clique no botão "AI Studio”.
Em seguida, clique no botão “Adicionar Novo Agente” para iniciar a criação.
Passo 2: Configurando o Agente e o Prompt
Nesta tela, você definirá o comportamento do seu agente. Para este exemplo, manteremos a configuração padrão de IA de Chat, que permite interagir com o agente de forma conversacional.
O coração do seu agente é o campo Meu Prompt. É aqui que você instrui a IA sobre sua persona, objetivos e o formato da resposta esperada. Um prompt bem estruturado garante resultados consistentes e de alta qualidade.
Para o nosso exemplo, vamos usar a seguinte estrutura:
# Persona
Você é um profissional de conteúdo especializado em transcrever e resumir gravações de aulas para estudantes. Sua linguagem deve ser sempre objetiva e direta.
# Objetivo
Seu objetivo principal é analisar e transcrever o conteúdo de uma gravação de aula fornecida pelo usuário e, a partir da transcrição, criar um resumo conciso do material abordado.
# Output (Formato da Resposta)
Você deve entregar um resumo do conteúdo transcrito em um total de até 30 linhas. O resumo deve destacar os principais tópicos e conceitos da aula.
# Regras
- Jamais invente informações que não estejam na gravação.
- Se o usuário fizer uma pergunta sobre um tópico não abordado na aula, informe que você não possui essa informação.
Passo 3: Criando a Entrada de Usuário para o Arquivo de Áudio
Para que o agente possa transcrever um áudio, ele precisa primeiro recebê-lo. Faremos isso criando uma "Entrada de Usuário".
Abaixo do campo do prompt, clique em Entradas de Usuário.
Selecione a opção Upload de arquivo.
No campo Nome da entrada, dê um nome simples, como “Arquivo”. Este será o campo onde o usuário fará o upload do áudio.
Clique em Salvar.
Passo 4: Adicionando o AI Step de Transcrição
Agora que o agente pode receber o arquivo, vamos adicionar a etapa que fará a transcrição.
Clique em AI Step.
Na lista de categorias, selecione AI Audio Transcription.
Em Tipo de etapa, você verá diferentes modelos de transcrição. Cada um tem seus pontos fortes:
AssemblyAI: Excelente qualidade de transcrição.
Deepgram: Foco em alta velocidade de processamento.
OpenAI (Whisper): Ótimo equilíbrio entre velocidade e qualidade.
Rev.ai: Ideal para áudios com múltiplos interlocutores, pois consegue diferenciar as vozes.
Para este exemplo, vamos escolher AssemblyAI.
Em Nome da etapa, defina um nome claro, como Transcrição do Arquivo.
No campo Media File, clique e selecione a variável que criamos no passo anterior: **arquivo**. Isso conecta a entrada do usuário diretamente ao step, garantindo que qualquer arquivo enviado será processado.
Selecione o idioma do áudio (ex: Português).
Clique em Salvar.
Passo 5: Conectando o Step ao Prompt
A IA precisa saber onde usar o resultado da transcrição. Para isso, vamos inserir a variável do step diretamente no nosso prompt.
Volte ao campo Meu Prompt.
Ao final do texto, adicione uma nova seção para o conteúdo que será analisado.
Seu prompt agora ficará assim:
“... (Persona, Objetivo, Output e Regras) ...
# Conteúdo para Análise
O conteúdo transcrito da aula é o seguinte:
**transcricao_do_arquivo**”
Passo 6: Salvando e Testando seu Agente
Com tudo configurado, seu agente está pronto para ser testado.
No canto superior direito, clique em Salvar.
Dê um nome para o seu agente, como "Resumo de Aulas", e salve.
Clique em Visualizar para abrir a interface de teste em uma nova aba.
Na tela de teste, você verá o campo de upload que criamos (arquivo). Suba um arquivo de áudio e clique para enviar.
Após o processamento, envie um comando no chat, como "Gere o resumo da aula".
A IA irá executar todo o fluxo: receberá o áudio, o step de transcrição será ativado, o texto resultante será inserido no prompt, e o agente seguirá suas instruções para gerar o resumo formatado.
Dica Extra: Combinando Steps para Fluxos Avançados
O poder dos AI Steps está na sua capacidade de combinação. Você pode criar agentes ainda mais complexos. Por exemplo, um fluxo de trabalho que:
Recebe um áudio em português (Entrada de Usuário).
Transcreve o áudio para texto (AI Step: Audio Transcription).
Traduz o texto para inglês (AI Step: AI Assistant, com um prompt para tradução).
Gera uma nova narração em inglês (AI Step: Audio Voice Over).
Isso demonstra como você pode construir soluções completas, conectando diferentes capacidades de IA em um único fluxo de trabalho automatizado.
Conclusão
Os AI Steps de Transcrição de Áudio da Tess AI são uma ferramenta transformadora para qualquer pessoa ou equipe que lida com conteúdo em áudio. Ao seguir este guia, você pode criar agentes personalizados que não apenas convertem fala em texto, mas também analisam, resumem e reformatam essas informações, economizando horas de trabalho manual e desbloqueando o verdadeiro valor dos seus arquivos de áudio.