Descifrando el Lenguaje de la IA
La inteligencia artificial está reescribiendo el mundo, y al mismo tiempo inventa un nuevo idioma para describir cómo lo hace. En reuniones, presentaciones o paneles de discusión, es común escuchar términos como LLM, RAG, RLHF y decenas de otros que pueden hacer sentir inseguros incluso a los profesionales más experimentados. Este glosario busca resolverlo: definiciones en español de los términos de IA que realmente encontrarás, ya sea que estés construyendo con esta tecnología, invirtiendo en ella o simplemente tratando de mantenerte al día. Lo actualizamos periódicamente a medida que el campo evoluciona, así que considéralo un documento vivo, al igual que los sistemas de IA que describe.
Conceptos Fundamentales
Inteligencia General Artificial (AGI) es un término nebuloso que generalmente se refiere a una IA más capaz que el humano promedio en muchas tareas. Sam Altman, CEO de OpenAI, la describió como el “equivalente de un humano mediano que podrías contratar como compañero de trabajo”. Por su parte, la carta de OpenAI define AGI como “sistemas altamente autónomos que superan a los humanos en la mayoría de los trabajos económicamente valiosos”.
Agente de IA es una herramienta que utiliza tecnologías de IA para realizar una serie de tareas en tu nombre, más allá de lo que un chatbot básico puede hacer: como gestionar gastos, reservar boletos o incluso escribir y mantener código. La infraestructura aún se está construyendo para cumplir con sus capacidades previstas.
Modelos y Arquitecturas
Modelo de Lenguaje Grande (LLM) son los modelos utilizados por asistentes populares como ChatGPT, Claude, Gemini o Copilot. Son redes neuronales profundas con miles de millones de parámetros que aprenden relaciones entre palabras y frases, creando un mapa multidimensional del lenguaje. Se entrenan con miles de millones de libros, artículos y transcripciones.
Aprendizaje Profundo es un subconjunto del aprendizaje automático donde los algoritmos tienen una estructura de red neuronal artificial multicapa, permitiendo correlaciones más complejas. Estos modelos pueden identificar características importantes por sí mismos, pero requieren millones de puntos de datos y tiempos de entrenamiento más largos.
Difusión es la tecnología en el corazón de muchos modelos generativos de arte, música y texto. Inspirada en la física, los sistemas de difusión “destruyen” lentamente la estructura de los datos añadiendo ruido, y luego aprenden un proceso de “difusión inversa” para restaurarlos.
Técnicas y Procesos
Destilación es una técnica para extraer conocimiento de un modelo grande utilizando un modelo “maestro-alumno”. El modelo pequeño se entrena para aproximar el comportamiento del grande, permitiendo crear versiones más eficientes. Se cree que OpenAI utilizó esto para desarrollar GPT-4 Turbo.
Ajuste Fino (Fine-tuning) se refiere al entrenamiento adicional de un modelo para optimizar su rendimiento en una tarea específica, alimentándolo con datos especializados. Muchas startups toman LLMs como punto de partida y los ajustan con conocimiento de dominio propio.
Razonamiento en Cadena de Pensamiento (Chain-of-Thought) implica descomponer un problema en pasos intermedios para mejorar la calidad del resultado. Los modelos de razonamiento se optimizan para este tipo de pensamiento gracias al aprendizaje por refuerzo.
Alucinaciones y Desafíos
Alucinación es el término preferido de la industria para cuando los modelos de IA inventan información incorrecta. Es un gran problema para la calidad de la IA, ya que puede generar resultados engañosos y riesgos potenciales, como consejos médicos dañinos. Se cree que surge de lagunas en los datos de entrenamiento.
Validación de Pérdida es un número que indica qué tan bien está aprendiendo un modelo durante el entrenamiento. Los investigadores lo monitorean para detectar sobreajuste, una condición en la que el modelo memoriza los datos de entrenamiento en lugar de aprender patrones generalizables.
Infraestructura y Hardware
RAMageddon es el término divertido para una tendencia no tan divertida: la escasez de chips de memoria RAM debido a la demanda masiva de la industria de IA. Las grandes empresas están comprando tanta RAM para sus centros de datos que queda poca para el resto, afectando a la industria de videojuegos, electrónica de consumo y computación empresarial.
Paralelización significa hacer muchas cosas al mismo tiempo. En IA, es fundamental tanto para el entrenamiento como para la inferencia. Las GPUs modernas están diseñadas para realizar miles de cálculos en paralelo, razón por la cual se convirtieron en la columna vertebral del hardware de la industria.
Este artículo se actualiza periódicamente con nueva información.