En pocas palabras
Zero-shot significa «cero ejemplos». Es la capacidad del modelo para resolver una tarea que no le has mostrado antes, solo leyendo lo que le pides. No le enseñas cómo se hace: le explicas qué quieres y él lo deduce con lo que ya sabe.
Explicado fácil
Imagina que tienes un amigo muy leído. Le dices: «ordena estas frutas de la más dulce a la menos dulce». Nunca has hecho ese juego con él, no le has dado ningún ejemplo, pero como sabe mucho de frutas, lo hace a la primera. Eso es zero-shot: acertar sin que nadie te haya mostrado un ejemplo antes.
Lo contrario sería darle pistas: «mira, la sandía es muy dulce, el limón es poco dulce; ahora ordena tú el resto». Eso de poner ejemplos en la instrucción se llama few-shot. Y si en vez de eso lo entrenaras a base de repetir el juego mil veces, sería fine-tuning. Zero-shot es el caso más sencillo: ningún ejemplo, solo la orden.
¿Por qué importa para crear agentes de IA?
Los modelos modernos son muy buenos en zero-shot para tareas comunes, y eso te ahorra trabajo: para muchas cosas basta con explicar bien lo que quieres, sin tener que preparar ejemplos. Al crear un agente, siempre conviene probar primero en zero-shot, porque es lo más rápido y barato. Si el modelo no acierta en una tarea más rara o especializada, entonces le añades unos ejemplos (few-shot) para guiarlo mejor. Empezar por lo simple y complicarlo solo si hace falta es una buena costumbre.
Un ejemplo
Le dices a un agente, sin más: «di si este comentario es positivo o negativo: me encantó la película, la volvería a ver». El modelo nunca ha visto ese ejemplo concreto, pero entiende la instrucción y responde «positivo». No necesitó que le enseñaras cómo se clasifican los comentarios: lo hizo en zero-shot, a la primera.