¿Cómo piensan los modelos de lenguaje como ChatGPT? Una guía sencilla para entender los LLMs
Hoy convivimos todos los días con modelos de lenguaje como ChatGPT, Gemini, Claude o Llama. Les pedimos que escriban correos, respondan dudas, preparen tareas, hagan resúmenes, incluso que nos cuenten chistes. Pero ¿cómo funciona por dentro esta inteligencia artificial que parece entendernos tan bien? Aunque parezca magia, todo parte de principios matemáticos, lingüísticos y computacionales que, si los explicamos bien, se entienden bastante fácil. Aquí te contamos los conceptos clave para entender cómo funciona un LLM (Large Language Model o Gran Modelo de Lenguaje).
1. Tokenización: partir el lenguaje en piezas manejables
El primer paso es convertir el lenguaje humano —ese mar de textos que hay en libros, páginas web, emails, redes sociales— en pedacitos más pequeños llamados t...