Contenido del curso

- Lección 9: La Explosión Actual - De AlphaGo a ChatGPT y la IA Generativa

Lección 9: La Explosión Actual - De AlphaGo a ChatGPT y la IA Generativa

Esta lección traza la línea desde los éxitos de nicho hasta la ubicuidad actual de la Inteligencia Artificial. Exploraremos el hito que capturó la imaginación global, seguiremos la evolución técnica vertiginosa y comprenderemos el cambio de paradigma fundamental que nos ha llevado a la era de la IA Generativa.

2016
AlphaGo vs. Lee Sedol

El programa AlphaGo de DeepMind derrota al campeón mundial Lee Sedol en el juego de Go, un hito considerado una década antes de tiempo. Go, con su vasto espacio de posibilidades (más que átomos en el universo observable), era el último gran desafío de juegos de mesa para la IA.

2017-2018
El Amanecer de los LLMs y la Arquitectura Transformer

Se publica el influyente artículo "Attention Is All You Need", introduciendo la arquitectura Transformer. Esto permite el entrenamiento eficiente de modelos de lenguaje a escala sin precedentes. OpenAI lanza GPT y Google presenta BERT, sentando las bases para la comprensión y generación de lenguaje natural.

2020-2022
Escalada y Multimodalidad

OpenAI lanza GPT-3, un modelo con 175 mil millones de parámetros, mostrando capacidades emergentes sorprendentes. Aparecen los primeros modelos generativos de imágenes de alta calidad como DALL-E y Midjourney, demostrando que la IA puede crear, no solo analizar.

2022-Presente
Ubicuidad y Herramientas Conversacionales

El lanzamiento de ChatGPT pone una IA generativa poderosa y conversacional al alcance de cientos de millones. La generación se expande a audio (podcasts, música) y video. La IA deja los laboratorios para integrarse en motores de búsqueda, suites ofimáticas y herramientas creativas diarias.

¿Cómo Funcionó AlphaGo? La Combinación Poderosa

AlphaGo no era un simple buscador de fuerza bruta. Su éxito se basó en una ingeniosa fusión de tres técnicas clave de IA moderna:

  • Redes Neuronales Convolucionales (CNNs): Para "ver" el tablero y evaluar posiciones, aprendiendo de miles de partidas humanas maestras.
  • Búsqueda en Árbol de Monte Carlo (MCTS): Para simular y explorar posibles secuencias de juego futuras de manera eficiente.
  • Aprendizaje por Refuerzo: Para que el sistema se perfeccionara a sí mismo jugando millones de partidas contra versiones anteriores, descubriendo estrategias novedosas más allá del conocimiento humano.

Esta combinación demostró que la IA podía superar la intuición y la creatividad humanas en dominios complejos.

La Evolución hacia los Modelos de Lenguaje Grande (LLMs)

El camino desde AlphaGo hasta ChatGPT está marcado por un cambio de enfoque: de sistemas especializados en una tarea (jugar Go) a modelos generalistas entrenados en datos masivos del mundo (texto de internet).

GPT (OpenAI)

Enfoque: Generativo. Predice la siguiente palabra en una secuencia.

Fuerza: Escritura creativa, redacción, finalización de texto, conversación.

Evolución: GPT (117M params) → GPT-2 (1.5B) → GPT-3 (175B) → GPT-4 (multimodal).

BERT (Google)

Enfoque: Bidireccional. Comprende el contexto completo de una palabra mirando a izquierda y derecha.

Fuerza: Comprensión del lenguaje, respuesta a preguntas, análisis de sentimiento, mejora de búsqueda.

Legado: Revolucionó la comprensión del lenguaje natural para tareas de análisis.

El Cambio de Paradigma Fundamental

La explosión actual representa una transición histórica en cómo construimos sistemas "inteligentes".

Paradigma Antiguo: IA Simbólica/Programada

  • Lógica: Reglas explícitas programadas por humanos ("si X, entonces Y").
  • Conocimiento: Ingeniería manual del conocimiento en bases de datos.
  • Alcance: Sistemas expertos estrechos, frágiles fuera de su dominio.
  • Ejemplo: Motor de ajedrez clásico, sistema de diagnóstico médico basado en reglas.

Paradigma Actual: IA de Aprendizaje/Generativa

  • Lógica: Patrones estadísticos aprendidos automáticamente de datos masivos.
  • Conocimiento: Representaciones distribuidas (vectores/embeddings) emergentes del entrenamiento.
  • Alcance: Modelos generalistas con capacidades emergentes y transferibles.
  • Ejemplo: ChatGPT que escribe, programa y razona; DALL-E que crea imágenes a partir de conceptos.

Hemos pasado de programar la inteligencia a entrenar la inteligencia a partir de la experiencia (datos).

La IA Generativa: Crear en lugar de Clasificar

La "IA Generativa" es la manifestación de este nuevo paradigma. Ya no se limita a clasificar una imagen ("esto es un gato") o traducir un texto. Ahora puede generar contenido original y coherente en múltiples modalidades:

  • Texto: Artículos, código, poesía, guiones (ChatGPT, Claude, Gemini).
  • Imagen: Ilustraciones, fotos realistas, diseños (DALL-E 3, Midjourney, Stable Diffusion).
  • Audio: Voz sintética natural, música en cualquier estilo (ElevenLabs, Suno).
  • Video: Generación y edición de clips a partir de descripciones (Sora, Runway).

El núcleo técnico suele ser una variante de la Arquitectura Transformer o Modelos de Difusión, que aprenden a construir datos complejos paso a paso a partir de ruido aleatorio.

Conclusión: El Fruto de 70 Años de Historia

La explosión actual de la IA Generativa no es un fenómeno aislado. Es el resultado directo y acumulativo del viaje de 70 años que hemos trazado en este curso:

  • De los primeros algoritmos (1950s-60s): Heredamos el marco teórico de la búsqueda y el aprendizaje.
  • De los sistemas expertos e inviernos de la IA (1970s-80s): Aprendimos los límites de la lógica programada y la necesidad de datos.
  • Del auge del aprendizaje automático y las redes neuronales (1990s-2000s): Adoptamos herramientas estadísticas y arquitecturas neuronales básicas.
  • Del Deep Learning (2010s): Aprovechamos el poder del hardware (GPUs) y los datos a gran escala para entrenar redes profundas, culminando en hitos como AlphaGo.

La lección clave: La IA actual es una convergencia de algoritmos potentes (Transformers), datos masivos (internet) y capacidad de computación a escala (nube, GPUs). Comprender esta explosión es comprender cómo toda la historia de la IA ha sido una escalada hacia este punto de inflexión, donde la tecnología ha pasado de ser una herramienta de nicho a una fuerza transformadora y ubicua en la sociedad.

Aquí trazamos la línea desde los éxitos de nicho hasta la ubicuidad actual. Empezaremos con el hito mediático de AlphaGo (DeepMind, 2016) venciendo al campeón mundial de Go, un juego de complejidad intuitiva. Explicaremos cómo combinó redes neuronales profundas con búsqueda y aprendizaje por refuerzo. Rastrearemos la rápida evolución hacia modelos de lenguaje grandes (LLMs) como GPT de OpenAI y BERT de Google, y el salto a la 'IA Generativa' que crea texto, imágenes (DALL-E, Midjourney), audio y video. Discutiremos el cambio de paradigma: de sistemas programados con reglas a modelos entrenados con datos que muestran capacidades emergentes. Concluiremos reflexionando sobre cómo esta fase actual es el resultado directo de los 70 años de historia cubiertos.

No se permite comentar en este curso.