Llevar agentes de IA a producción (no demos)
La mayoría de las demos de agentes de IA parecen mágicas y se desmoronan en cuanto se topan con datos reales, carga real y consecuencias reales. La distancia entre una demo y un sistema que puedes llevar a producción no es el modelo — es todo lo que lo rodea.
Una demo optimiza el camino feliz
Las demos se construyen para impresionar en dos minutos: una entrada limpia, una salida segura. Producción es lo contrario. Es el payload mal formado, el timeout, la petición ambigua, el caso límite que nadie guionizó. Un agente que solo funciona en el camino feliz es un riesgo la primera vez que se encuentra con la realidad.
Qué exige producción de verdad
Cuando metemos agentes en flujos de finanzas y tesorería — donde una acción equivocada tiene un coste real — algunas cosas son innegociables:
- Guardrails antes que autonomía. El agente propone; las restricciones deciden qué tiene permitido hacer. Las acciones de alto impacto están acotadas, validadas y son reversibles.
- Human-in-the-loop donde importa. No todo necesita aprobación, pero las acciones que mueven dinero o cambian estado deben pararse para un humano cuando la confianza es baja.
- Observabilidad. Cada decisión se registra con sus entradas, el razonamiento y el resultado. Si no puedes explicar lo que hizo el agente, no puedes confiar en él — ni depurarlo.
- Bordes deterministas. El modelo se encarga del juicio; el código plano se encarga de lo que debe ser exacto. No le pides a un LLM que haga una aritmética que debería hacer una función.
Trátalo como software, porque lo es
Los equipos que tienen éxito con agentes dejan de tratarlos como una caja negra mágica y empiezan a tratarlos como software: versionado, probado, monitorizado y desplegado tras los mismos controles que el resto del stack. El modelo es un componente. El sistema es el producto.
Esa es la diferencia entre una demo y algo que un equipo de tesorería dejará acercarse de verdad a sus pagos — y es donde pasamos la mayor parte del tiempo.