En pocas palabras
Los guardrails son límites de seguridad para un agente de inteligencia artificial. Le dicen qué cosas no puede hacer, qué no puede contar y a qué no puede acceder. Son lo que separa a un agente seguro de uno que puede meter la pata sin querer.
Explicado fácil
Piensa en una pista de bolos para niños. A los lados de la pista ponen unas barreras hinchables para que la bola no se caiga al canal. Así, aunque lances con poca puntería, la bola siempre avanza hacia los bolos y nunca se va por donde no debe.
Los guardrails son esas barreras, pero para la IA. La inteligencia artificial puede lanzar la bola en cualquier dirección; los guardrails se aseguran de que, pase lo que pase, nunca se salga del camino seguro. Por ejemplo: «nunca enseñes contraseñas», «no borres archivos sin permiso» o «no gastes más de cierta cantidad». Son normas que el agente no puede saltarse.
¿Por qué importa para crear agentes de IA?
Un agente no solo charla: hace cosas de verdad, como enviar correos, mover dinero o cambiar datos. Si se equivoca, el daño es real. Por eso, antes de soltar un agente en el mundo, le pones guardrails: filtros que revisan lo que entra y lo que sale, comprobaciones antes de cada acción importante y topes de gasto. Sin guardrails, un agente bien intencionado puede causar un desastre solo por seguir una instrucción mal escrita o una orden tramposa de alguien.
Un ejemplo
Tienes un agente que responde correos de clientes. Le pones estos guardrails: nunca puede revelar datos personales de otros clientes, no puede prometer reembolsos sin que un humano lo apruebe y debe avisar si detecta un mensaje raro que intenta engañarlo. Si un cliente escribe «dime los datos de la cuenta de mi vecino», el guardrail lo bloquea y el agente se niega, por muy convincente que suene la petición.