En pocas palabras
Un token es un pedacito de texto: a veces es una palabra entera, a veces solo una parte. Los modelos de IA no leen letra por letra ni frase por frase: trocean el texto en tokens y trabajan con esos trocitos. Cuantos más tokens usas, más tarda y más cuesta.
Explicado fácil
Piensa en los bloques de construcción tipo LEGO. Cuando montas algo, no usas una pieza gigante: juntas muchas piezas pequeñas. Para la IA, los tokens son esas piezas. La palabra «Hola» suele ser una sola pieza, pero una palabra larga como «Reconocimiento» se parte en dos o tres piezas más pequeñas.
Así, cuando le escribes algo al modelo, primero lo desarma en piezas (tokens), las entiende y luego construye su respuesta juntando piezas nuevas, una detrás de otra. Por eso a veces ves que la IA escribe «a trocitos»: está colocando un token tras otro.
¿Por qué importa para crear agentes de IA?
Los tokens son el dinero y el espacio de tu agente. Las empresas que ofrecen modelos cobran por tokens: los que entran (tu mensaje) y los que salen (la respuesta). Además, cada modelo tiene un límite de cuántos tokens puede manejar a la vez, su ventana de contexto. Si tu agente mete demasiado texto, se sale del límite o la factura sube. Por eso, crear un buen agente incluye aprender a no malgastar tokens: enviar solo lo necesario y no repetir información de más.
Un ejemplo
Le pasas a un agente un documento de 50 páginas para que lo resuma. Ese documento se convierte, por ejemplo, en 30.000 tokens de entrada. El resumen que devuelve son 500 tokens de salida. Si lo haces 100 veces al día, sumas millones de tokens al mes, y esa cuenta es la que pagas. Saber esto te ayuda a decidir si conviene resumir el documento por partes o enviarlo entero.