programadoresargentina·
Hermes Agent: agentes de IA que recuerdan, aprenden workflows y no arrancan de cero cada vez
La mayoría de agentes de IA tienen un problema simple: olvidan demasiado rápido . Podés pasar una hora explicándole cómo funciona tu proyecto, corregirle convenciones, mostrarle cómo se corren los tests o guiarlo hasta resolver un bug complejo. Pero en la siguiente sesión, muchas veces vuelve a comportarse como si nada hubiera pasado. Ese es el problema que Hermes Agent intenta resolver. Hermes no es solo un chatbot con herramientas. Es un framework para crear agentes que pueden mantener memoria entre sesiones, guardar procedimientos reutilizables y ejecutar tareas de forma más persistente. La promesa no es “un agente mágico que hace todo solo”. La idea es más concreta: Que un agente pueda recordar contexto útil, aprender cómo trabajás y reutilizar ese aprendizaje en tareas futuras. Qué problema intenta resolver Hoy muchos usamos IA para programar, investigar, escribir, diseñar o automatizar tareas. El problema aparece cuando esas tareas requieren contexto. Por ejemplo: cómo está organizado un proyecto, qué convenciones usa un equipo, qué comandos funcionan, qué errores ya se resolvieron, qué estilo de respuesta prefiere una persona, qué pasos hay que seguir para una tarea repetida. Sin memoria, el agente depende de que le expliques todo de nuevo. Hermes intenta reducir esa fricción. Cómo lo hace Hermes combina varias piezas: Identidad + Memoria + Skills + Automatización Cada una cumple una función distinta. 1. Identidad: definir cómo debe comportarse el agente Hermes usa un archivo llamado SOUL.md . Ahí se define la personalidad y el criterio del agente. Por ejemplo, para un agente programador podrías definir: You are a pragmatic staff engineer. Read code before writing code. Prefer small changes. Run tests before saying done. Esto evita que todos los agentes se comporten igual. Podés tener un agente programador, uno investigador y uno diseñador, cada uno con una forma distinta de trabajar. 2. Memoria: guardar contexto útil Hermes maneja memoria en distintos niveles. El primer nivel son archivos simples como: MEMORY.md USER.md Ahí se guarda información importante: - El proyecto usa pnpm. - El backend espera sort=name,asc. - El usuario prefiere respuestas directas. - Evitar agregar dependencias sin revisar alternativas. Esto sirve para que el agente no tenga que reaprender lo básico en cada sesión. También guarda conversaciones en una base SQLite, para poder buscar contexto histórico cuando hace falta. La diferencia es importante: la memoria corta está siempre disponible, el historial completo se busca cuando se necesita. 3. Skills: guardar procedimientos, no solo datos La parte más interesante de Hermes son las skills. Una skill es un procedimiento reutilizable. No guarda simplemente “información”, sino una forma de hacer algo. Ejemplo: --- name: debug-kubernetes-pod description: Use when a pod is crashing or restarting. --- ## Procedure 1. Check pod status. 2. Review events. 3. Pull logs. 4. Check previous logs if the container restarted. 5. Look for OOMKilled, ImagePullBackOff or config errors. ## Pitfalls - Forgetting to use --previous. Esto permite que el agente no resuelva siempre desde cero. Si ya encontró una forma correcta de hacer algo, puede guardarla y reutilizarla. 4. Skills auto-generadas Hermes puede crear skills por sí mismo. Por ejemplo, si durante una tarea el agente: tuvo que probar varios caminos, recibió una corrección importante, descubrió un workflow útil, o resolvió algo que probablemente se repita, puede guardar ese procedimiento como una skill. El ciclo sería: Resuelve una tarea → identifica un aprendizaje reutilizable → crea una skill → la usa en futuras tareas similares Esto es lo que hace que Hermes sea diferente de un agente común. No solo ejecuta. También intenta acumular experiencia. 5. Curator: evitar que las skills se vuelvan basura Si un agente puede crear skills, también puede crear demasiadas skills malas, repetidas o demasiado específicas. Hermes incluye un sistema llamado Curator para revisar esas skills. Puede: mantenerlas, mejorarlas, fusionarlas, archivarlas. Esto es importante porque la memoria sin mantenimiento se vuelve ruido. Hermes no elimina todo de forma agresiva. Archiva y permite volver atrás. 6. GEPA: mejorar skills con evaluación offline GEPA es una herramienta complementaria para optimizar skills. No entrena el modelo. No hace fine-tuning. Lo que hace es probar variantes de una skill, mirar trazas de ejecución y evaluar cuál funciona mejor. La idea es simple: Tomar una skill → generar casos de prueba → crear variantes → evaluarlas → quedarse con la mejor Esto sirve porque los agentes no siempre son buenos evaluándose a sí mismos. Pueden creer que resolvieron algo bien cuando no fue así. GEPA agrega una capa de validación más objetiva.