
Inteligencia Artificial Generativa para Desarrolladores (AI-Powered)
Al finalizar este curso podrás:
- ✅ Construir sistemas RAG completos con LangChain, bases de datos vectoriales y embeddings.
- ✅ Dominar la ingeniería de prompts con técnicas avanzadas: chain-of-thought, few-shot, ReAct.
- ✅ Diseñar y desplegar agentes autónomos con herramientas, memoria y orquestación (CrewAI, AutoGen).
- ✅ Consumir APIs de modelos (OpenAI, Claude, Ollama) e integrarlos en aplicaciones reales.
- ✅ Evaluar, hacer fine-tuning eficiente (LoRA/QLoRA) y poner en producción sistemas de IA generativa.
Contenido del curso
La inteligencia artificial generativa ha transformado radicalmente la industria del software. Modelos como GPT-4, Claude, Llama y Mistral ya no son solo chatbots: son motores de razonamiento que se integran en aplicaciones reales a través de APIs, bases de datos vectoriales, agentes autónomos y flujos de aumento de recuperación (RAG).
Este curso está diseñado para desarrolladores de software que quieren pasar de consumir herramientas de IA a construir con IA: crear asistentes personalizados, sistemas RAG, agentes que ejecutan tareas y aplicaciones que entienden lenguaje natural.
A diferencia de otros cursos, aquí la IA es tanto el tema como la herramienta de enseñanza: usarás asistentes de código (Continue.dev + DeepSeek) durante todo el curso, pero también aprenderás a orquestar modelos, evaluar su rendimiento y construir pipelines completos de generación aumentada.
Objetivos🔗
- Comprender el ecosistema de modelos fundacionales (LLMs) y cuándo usar cada uno (GPT, Claude, Llama, Mistral) con análisis asistido por IA.
- Construir sistemas RAG (Retrieval-Augmented Generation) con LangChain, bases de datos vectoriales (ChromaDB, Qdrant) y embeddings.
- Diseñar y ejecutar agentes autónomos con herramientas, memoria y orquestación.
- Desplegar aplicaciones de IA generativa en producción con monitoreo y evaluación.
Temario🔗
Fundamentos de LLMs🔗
- ¿Qué es un modelo fundacional? — arquitectura Transformer.
- Tokens, embeddings y atención: el pilar de los LLMs.
- Diferencias entre modelos: propietarios (GPT-4, Claude) vs abiertos (Llama 3, Mistral, DeepSeek).
- Parámetros, contexto y ventana de tokens.
- El desafío de la alucinación y cómo mitigarlo.
- Práctica con IA: Usa Continue.dev para consultar un modelo local (Ollama) y otro remoto (DeepSeek), compara sus respuestas y analiza diferencias de estilo y precisión.
Ingeniería de Prompts (Prompt Engineering)🔗
- Estructura de un prompt: sistema, usuario, asistentes, contexto.
- Técnicas: few-shot, chain-of-thought, ReAct.
- System prompts: definiendo el rol y las reglas del modelo.
- Formato de salida estructurado: JSON mode, function calling.
- Práctica con IA: Prompt socrático: "Diseña un prompt que convierta texto libre en SQL. La IA revisa tu prompt y te pregunta qué casos frontera no estás cubriendo."
APIs de Modelos🔗
- OpenAI API: chat completions, embeddings, streaming.
- Anthropic Claude API: mensajes, herramientas, manejo de contexto largo.
- Modelos abiertos vía Ollama y OpenRouter.
- Costos, límites de tasa y manejo de errores.
- Práctica con IA: Construye un cliente en Python que consuma el mismo programa con OpenAI y Ollama, intercambiando el backend. La IA ayuda a abstraer la interfaz.
Embeddings y Bases de Datos Vectoriales🔗
- ¿Qué es un embedding y cómo se genera?
- Similitud coseno y búsqueda semántica.
- ChromaDB: base de datos vectorial embebida.
- Qdrant / Pinecone / Weaviate (visión general).
- Práctica con IA: Genera embeddings de documentos reales (PDFs, Markdown) y la IA te guía en la elección del modelo de embedding según el idioma y dominio.
RAG (Retrieval-Augmented Generation)🔗
- Arquitectura RAG: ingestión → indexación → recuperación → generación.
- Chunking estratégico: tamaño, solapamiento, splitting semántico.
- LangChain: cadenas, retrievers, document loaders.
- Evaluación de RAG: fidelidad, relevancia, recall.
- Práctica con IA: Construye un RAG que responda preguntas sobre la documentación de ByteLabs. La IA revisa los chunks generados y sugiere mejoras de chunking.
LangChain Avanzado🔗
- Chains: secuencias de llamadas al modelo.
- Memory: buffers de conversación, ventanas, resúmenes.
- Tools: darle al modelo la capacidad de ejecutar código, buscar en la web, consultar APIs.
- LangChain Expression Language (LCEL).
- Práctica con IA: Construye un chatbot que recuerde la conversación y pueda ejecutar comandos de sistema. La IA actúa como revisor de seguridad.
Agentes con IA🔗
- ¿Qué es un agente? — razonamiento + acciones.
- Frameworks: LangChain Agents, CrewAI, AutoGen.
- Herramientas personalizadas: envolturas de APIs y código.
- Ejecución con supervisión humana (human-in-the-loop).
- Práctica con IA: Prompt para diseñar un agente que investigue un tema: busque en la web, resuma en un archivo y envíe un correo. La IA revisa la arquitectura por seguridad.
Fine-Tuning y RAG vs Fine-Tuning🔗
- ¿Cuándo hacer fine-tuning vs cuándo usar RAG?
- LoRA / QLoRA: fine-tuning eficiente en parámetros.
- Datasets de entrenamiento: formato, calidad, aumentación.
- Evaluación de modelos fine-tuned.
- Práctica con IA: El asistente analiza un caso de uso real del alumno y recomienda si debe usar RAG, fine-tuning o ambos, justificando cada decisión.
Evaluación y monitoreo en producción🔗
- Métricas: BLEU, ROUGE, BERTScore, LLM-as-a-Judge.
- Evaluación automática con cadenas de evaluación.
- Monitoreo: latencia, costos, tasas de error, alucinaciones.
- Guardrails: prevenir salidas no deseadas con NeMo Guardrails o Guardrails AI.
- Práctica con IA: Construye un evaluador automático que use un LLM para calificar las respuestas de otro LLM. La IA analiza los falsos positivos del evaluador.
Temas selectos (opcionales)🔗
- Multimodalidad: procesar imágenes con GPT-4o / Claude 3.5.
- Text-to-Speech y Speech-to-Text (Whisper, ElevenLabs).
- Construcción de asistentes por voz.
- Open-source local con Ollama + Open WebUI.
- Ética y sesgos en IA generativa.
- Práctica con IA: Ingeniería de prompts: "Diseña un asistente de voz que tome pedidos de un restaurante. La IA te guía en la arquitectura de agentes y manejo de contexto."
🎯 Proyecto final del curso
Construirás un asistente RAG completo que responda preguntas sobre documentación técnica (PDFs, Markdown) usando LangChain + ChromaDB + OpenAI/DeepSeek, con interfaz web en Streamlit, chunking estratégico, evaluación de fidelidad y relevancia, y despliegue en producción con monitoreo.