El Harness: la infraestructura que hace funcionar a un agente

Día 4 / 60

He esperado mucho para hablar de esto. Harness es uno de esos conceptos que parece técnico y denso al inicio, pero que una vez que lo entiendes cambia cómo piensas de los agentes. El término llegó a mi vida hace poco, pero se está volviendo rápidamente popular en la comunidad de AI agents en X.

¿Qué es el Harness?

El harness es la infraestructura que rodea al modelo para que el agente pueda correr tareas de larga duración. No es el agente en sí. Es cómo el agente opera.

La metáfora más simple que se me ocurre:

Quiero construir un auto. El motor es el LLM. El harness es todo lo demás — el volante, las ruedas, los frenos, la carrocería — y sobre todo, cómo están interconectados para que el auto funcione.

Para los que les gustan los computadores hay una metáfora mejor: los procesadores son los modelos, la RAM es el manejo del contexto, y el resto — la placa madre, los ventiladores, el teclado, la pantalla y cómo todo está conectado — es el harness.

Diagrama de un Agent Harness

Fuente: philschmid.de

En un agente, el harness incluye:

Los prompts que usa
Las tools o skills disponibles
La lógica con la que elige y ejecuta esas tools
La gestión del contexto
El estado
Las capacidades de planificación
La memoria
Los guardrails
Y un montón de cosas que probablemente estoy olvidando

Nueve agentes, nueve harnesses distintos

He construido varios agentes a lo largo del tiempo:

Billi, Tsukasa, A0x, Jesse XBT (en su fase inicial), Tomás, Claudio, Felipe, Pedro y Don Nelson.

Cada uno tuvo un harness diferente. No porque hagan cosas distintas, sino porque mi forma de construir agentes ha cambiado mucho. Cada iteración aprendí algo que no sabía antes.

Lo que nos enseña la industria

Hay tres ejemplos que me parecen muy reveladores:

Manus — uno de los primeros agentes públicos reconocidos, refactorizó su harness 5 veces en 6 meses.

LangChain cambió su harness 3 veces en un año.

Vercel eliminó el 80% de sus tools para responder más rápido y gastar menos tokens.

La conclusión es simple: el harness tiene que ser lo más liviano y modular posible. Cada nuevo modelo se comporta diferente. El harness que funciona hoy puede no funcionar mañana.

Algunos consejos si estás empezando

Si estás construyendo el harness de tu agente o flujo agéntico, hay tres cosas que creo que marcan la diferencia desde el inicio:

Mantenlo simple. Simple es mejor. Pero simple es difícil.

Hazlo modular. Los modelos cambian rápido. Si tu harness está acoplado a una versión específica de algo, vas a tener que volver a hacerlo entero cuando el modelo cambie. Me ha pasado :(.

Los prompts ya no son ventaja competitiva. La trayectoria que captura tu harness sí lo es. Cada vez que tu agente falla en seguir una instrucción es una oportunidad para mejorar. Eso se acumula y con el tiempo es muy difícil de replicar.

Avances: Don Nelson a prueba

En el primer post mencioné tres cosas que necesitaba resolver para llegar al CEN.

La primera, y para mí la más difícil, ya está resuelta: tengo un cliente que me pasó una carta escenario real. Ya tengo un caso de estudio concreto.

La licencia de DIgSILENT está a pocos días de resolverse. A partir de ahí, el ritmo depende solo de mí.

En los próximos posts voy a entrar directamente al harness de Don Nelson — cómo está construido hoy, qué he aprendido de él, y qué voy a cambiar para que pueda presentar un estudio que el CEN apruebe.

Algunas referencias por si quieren aprender más de Harness: