Nossa API oferece os seguintes formatos para execução de agentes:
Execute Agent (Síncrono)
Execute Agent Stream (Assíncrono com Streaming)
OpenAI-compatible API
Este formato executa o agente de forma síncrona, ou seja, a chamada à API aguarda a conclusão total da execução antes de retornar uma resposta.
Como Funciona:
Você envia uma solicitação para executar o agente e recebe uma resposta JSON completa contendo:
O log detalhado de cada etapa da execução (pensamentos, chamadas de ferramentas, resultados).
A resposta final gerada pelo agente.
Quando Usar:
Integrações simples onde você precisa apenas do resultado final e não requer feedback em tempo real.
Processamento em lote ou geração de relatórios.
Casos em que a latência não é uma preocupação crítica.
Vantagens:
Implementação mais fácil e direta.
Menos complexidade no lado do cliente, pois você recebe uma única resposta.
Desvantagens:
Maior latência aparente, pois o cliente precisa esperar até que toda a execução seja concluída.
Não adequado para interfaces interativas em tempo real.
Este formato executa o agente de forma assíncrona, fornecendo feedback em tempo real através de um fluxo de dados (streaming).
Como Funciona: Você envia uma solicitação para executar o agente com o parâmetro de streaming ativado. A API estabelece uma conexão HTTP persistente e envia eventos incrementais à medida que o agente avança:
Tokens de pensamento sendo gerados.
Comandos de ferramentas sendo invocados e seus resultados.
A resposta final sendo construída em partes.
Quando Usar:
Interfaces de chat em tempo real.
Exibição de progresso e logs em tempo real.
Aplicações onde a experiência do usuário se beneficia do feedback imediato.
Vantagens:
Menor latência aparente, pois o cliente recebe dados progressivamente.
Melhora a experiência do usuário, permitindo interatividade em tempo real.
Desvantagens:
Implementação mais complexa no lado do cliente, exigindo o tratamento de fluxos de dados.
Maior uso de recursos de rede devido ao envio de múltiplos chunks de dados.
Este formato oferece uma API que segue os padrões da API OpenAI, facilitando a integração com ferramentas e bibliotecas existentes.
Como Funciona: A API Tess AI implementa os mesmos padrões de chamadas, formatos de dados e autenticação da API OpenAI. Isso permite que você use clientes e integrações OpenAI padrão com a API Tess AI, minimizando a necessidade de adaptações.
Quando Usar:
Quando você já possui aplicativos ou clientes projetados para funcionar com a API OpenAI.
Para facilitar a migração ou integração com sistemas existentes baseados em OpenAI.
Para aproveitar bibliotecas e frameworks que suportam a API OpenAI.
Vantagens:
Compatibilidade com o ecossistema OpenAI.
Facilidade de integração e migração.
Redução do tempo de desenvolvimento ao utilizar ferramentas existentes.
Desvantagens:
Pode não oferecer acesso a todas as funcionalidades específicas da API Tess AI.
A tabela a seguir resume as principais diferenças entre os formatos e ajuda você a escolher a melhor opção para seu caso de uso:
Característica | Execute Agent | Execute Agent Stream | OpenAI-compatible API |
Tempo até 1ª resposta | Após a conclusão total | Imediato (primeiro token) | Depende da operação |
Latência aparente | Maior | Menor | Variável |
Complexidade cliente | Baixa | Média | Baixa a Média |
Interatividade | Nenhuma | Alta | Depende |
Casos de uso típicos | Processamento em lote, relatórios | Chat em tempo real, logs ao vivo | Integração com ferramentas OpenAI |
Ao escolher o formato de execução de agentes na API Tess AI, considere os requisitos específicos do seu aplicativo, a necessidade de feedback em tempo real e a compatibilidade com ferramentas existentes. Avalie as vantagens e desvantagens de cada formato para garantir a melhor experiência do usuário e otimizar o desempenho da sua aplicação.
Se tiver dúvidas ou precisar de ajuda para escolher o formato mais adequado, entre em contato com nossa equipe de suporte!!