Nuestra API ofrece los siguientes formatos para ejecutar agentes:
Ejecutar Agente (Síncrono)
Ejecutar Agente Stream (Asíncrono con Streaming)
API compatible con OpenAI
Este formato ejecuta el agente de forma síncrona, o sea, la llamada a la API espera a que termine toda la ejecución antes de devolver una respuesta.
Cómo funciona:
Envías una solicitud para ejecutar el agente y recibes una respuesta JSON completa con:
El registro detallado de cada paso de la ejecución (pensamientos, llamadas a herramientas, resultados).
La respuesta final generada por el agente.
Cuándo usar:
Integraciones simples donde solo necesitas el resultado final y no requieres retroalimentación en tiempo real.
Procesos por lotes o generación de reportes.
Casos donde la latencia no es una preocupación crítica.
Ventajas:
Implementación más fácil y directa.
Menos complicación del lado del cliente, porque solo recibes una respuesta.
Desventajas:
Mayor latencia aparente ya que el cliente tiene que esperar hasta que termine toda la ejecución.
No es adecuado para interfaces interactivas en tiempo real.
Este formato ejecuta el agente de manera asíncrona, dando feedback en tiempo real a través de un flujo de datos (streaming).
Cómo funciona: Tú envías una solicitud para ejecutar el agente con el parámetro de streaming activado. La API mantiene una conexión HTTP persistente y va enviando eventos incrementales mientras el agente avanza:
Tokens de pensamiento siendo generados.
Comandos de herramientas siendo invocados y sus resultados.
La respuesta final se va construyendo en partes.
Cuándo usar:
Interfaces de chat en tiempo real.
Visualización de progreso y logs en tiempo real.
Apps donde la experiencia de usuario mejora con feedback inmediato.
Ventajas:
Menor latencia aparente porque el cliente recibe los datos poco a poco.
Mejora la experiencia de usuario permitiendo interactividad en tiempo real.
Desventajas:
Implementación más complicada del lado del cliente, ya que hay que manejar flujos de datos.
Mayor uso de red porque se envían varios chunks de datos.
Este formato ofrece una API que sigue los estándares de la API de OpenAI, haciendo más fácil la integración con herramientas y bibliotecas que ya existen.
Cómo funciona: La API Tess AI implementa los mismos estándares de llamadas, formatos de datos y autenticación que la API de OpenAI. Esto te permite usar los clientes e integraciones estándar de OpenAI con la API Tess AI, minimizando la necesidad de hacer cambios.
Cuándo usar:
Cuando ya tienes apps o clientes pensados para funcionar con la API de OpenAI.
Para facilitar la migración o integración con sistemas ya existentes basados en OpenAI.
Para aprovechar bibliotecas y frameworks que soportan la API de OpenAI.
Ventajas:
Compatible con el ecosistema OpenAI.
Integración y migración fáciles.
Reducción del tiempo de desarrollo usando herramientas ya existentes.
Desventajas:
Puede que no tengas acceso a todas las funciones específicas de la API Tess AI.
La siguiente tabla resume las diferencias principales entre los formatos y te ayuda a elegir la mejor opción para tu caso de uso:
Característica | Ejecutar agente | Ejecutar agente en flujo | API compatible con OpenAI |
Tiempo hasta la primera respuesta | Después de la conclusión total | Inmediato (primer token) | Depende de la operación |
Latencia aparente | Mayor | Menor | Variable |
Complejidad del cliente | Baja | Media | Baja a media |
Interactividad | Ninguna | Alta | Depende |
Casos de uso típicos | Procesamiento por lotes, reportes | Chat en tiempo real, logs en vivo | Integración con herramientas OpenAI |
Al elegir el formato de ejecución de agentes en la API Tess AI, fíjate en los requisitos específicos de tu app, si necesitas feedback en tiempo real y si es compatible con tus herramientas. Piensa en las ventajas y desventajas de cada formato para asegurar la mejor experiencia para el usuario y sacarle el máximo partido al rendimiento de tu aplicación.
Si tienes dudas o si necesitas ayuda para elegir el formato que más te conviene, habla con nuestro equipo de soporte!!