Ao construir um agente no AI Studio da Tess AI, você pode ir muito além de um simples treinamento. Com os Steps Avançados, você pode criar agentes que executam tarefas prévias, processam informações de múltiplas fontes antes de iniciar a conversa (agente de chat) ou entregar o resultado final (agente de texto).
Quando apenas Prompt não é suficiente no agente?
Imagine que você quer criar um agente e automatizar a geração de uma descrição de um produto. Todas as informações sobre esse produto estão em um catálogo em PDF.
Se você apenas der o arquivo PDF ao agente na entrada do usuário, ele não saberá o que fazer. A IA precisa de uma instrução para, primeiro, ler e interpretar o conteúdo daquele arquivo. É exatamente para isso que servem os Steps Avançados: eles dão ao seu agente a capacidade de executar ações preliminares para complementar o contexto necessário do seu treinamento.
Exemplos de Steps Avançados Disponíveis
Você pode equipar seu agente com uma variedade de "sentidos" e habilidades, incluindo:
Extração de texto de PDF: Permite que o agente leia e extraia todo o texto de um documento PDF.
Leitura de imagens com OCR: Uma habilidade poderosa para extrair texto que está dentro de imagens (como em um panfleto digitalizado ou um print de tela).
Leitura de páginas selecionadas de um PDF: Otimiza o processo, permitindo que você instrua o agente a focar apenas nas páginas relevantes de um documento longo.
Web Scraping: Transforma seu agente em um "leitor de internet", capaz de extrair informações de páginas da web, como o conteúdo de um artigo ou dados de um e-commerce.
Pesquisa no Google: Permite que o agente faça uma pesquisa no Google e utilize os resultados como base para a sua resposta.
Como Funciona na Prática: A Sequência de Ações
Quando você configura um Step Avançado, você está definindo uma linha de montagem para o seu agente:
Entrada do Usuário: O usuário fornece o material inicial (ex: um arquivo PDF, uma URL de um site).
Execução do Step Avançado: O agente executa a ação que você configurou (ex: extrai o texto do PDF, faz o web scraping da URL).
Contextualização para a IA: O resultado do step (o texto extraído, o conteúdo do site) é automaticamente fornecido como informação de contexto para a IA.
Geração da Resposta Final: A IA, agora com as informações necessárias, executa o seu prompt principal (ex: "Crie uma descrição de produto com base no texto extraído") e entrega o resultado.
Pontos de Atenção para o Uso Eficaz
Impacto no Tempo de Processamento
Lembre-se que cada Step Avançado é uma tarefa adicional no fluxo inicial de trabalho do seu agente. Isso pode aumentar um pouco o tempo de processamento para iniciar a conversa (agente de chat), ou para entregar o resultado final (agente de texto). Portanto, use-os de forma estratégica, apenas quando forem realmente necessários.
Eles não rodam ao longo de um chat
Como o principal objetivo de um step é complementar o treino com tarefas e recursos avançados, ele rodará no início de um chat ou processamento do agente de Texto.
Exemplo:
Sabemos que há um agente que cria eventos na agenda do Google Calendar. Esse step não é acionado ao longo de uma conversa no chat, por exemplo, ele roda no início, logo depois do usuário completar os inputs necessários.
Então, se eu precisasse criar um agente que criasse eventos na minha agenda eu precisaria:
Incluir um step para pegar as informações da agenda (App Integration)
Rodar um assistente de IA que visse os slots disponíveis e estabelecesse o novo horário
Coletar via entradas as informações requeridas para criar um evento
Usar o step de criação de evento
Ou seja, antes de conversar com o chat, isso tudo precisaria acontecer.
A Conexão Crucial com o Prompt
Não basta apenas adicionar um Step Avançado; você precisa instruir a IA no seu prompt sobre como usar a informação que ele fornece.
Exemplo: Se você adicionou um step de "Extração de texto de PDF", seu prompt principal deve conter algo como:
“Com base no texto extraído do documento, identifique os principais benefícios do produto e escreva três parágrafos sobre eles: texto-do-pdf”
Essa instrução conecta a ação do step com o raciocínio do LLM, garantindo que a informação coletada seja usada de forma eficaz.