Inteligencia Artificial Generativa para Desarrolladores (AI-Powered)

Al finalizar este curso podrás:

✅ Construir sistemas RAG completos con LangChain, bases de datos vectoriales y embeddings.
✅ Dominar la ingeniería de prompts con técnicas avanzadas: chain-of-thought, few-shot, ReAct.
✅ Diseñar y desplegar agentes autónomos con herramientas, memoria y orquestación (CrewAI, AutoGen).
✅ Consumir APIs de modelos (OpenAI, Claude, Ollama) e integrarlos en aplicaciones reales.
✅ Evaluar, hacer fine-tuning eficiente (LoRA/QLoRA) y poner en producción sistemas de IA generativa.

Contenido del curso

La inteligencia artificial generativa ha transformado radicalmente la industria del software. Modelos como GPT-4, Claude, Llama y Mistral ya no son solo chatbots: son motores de razonamiento que se integran en aplicaciones reales a través de APIs, bases de datos vectoriales, agentes autónomos y flujos de aumento de recuperación (RAG).

Este curso está diseñado para desarrolladores de software que quieren pasar de consumir herramientas de IA a construir con IA: crear asistentes personalizados, sistemas RAG, agentes que ejecutan tareas y aplicaciones que entienden lenguaje natural.

A diferencia de otros cursos, aquí la IA es tanto el tema como la herramienta de enseñanza: usarás asistentes de código (Continue.dev + DeepSeek) durante todo el curso, pero también aprenderás a orquestar modelos, evaluar su rendimiento y construir pipelines completos de generación aumentada.

Objetivos🔗

Comprender el ecosistema de modelos fundacionales (LLMs) y cuándo usar cada uno (GPT, Claude, Llama, Mistral) con análisis asistido por IA.
Construir sistemas RAG (Retrieval-Augmented Generation) con LangChain, bases de datos vectoriales (ChromaDB, Qdrant) y embeddings.
Diseñar y ejecutar agentes autónomos con herramientas, memoria y orquestación.
Desplegar aplicaciones de IA generativa en producción con monitoreo y evaluación.

Temario🔗

Fundamentos de LLMs🔗

¿Qué es un modelo fundacional? — arquitectura Transformer.
Tokens, embeddings y atención: el pilar de los LLMs.
Diferencias entre modelos: propietarios (GPT-4, Claude) vs abiertos (Llama 3, Mistral, DeepSeek).
Parámetros, contexto y ventana de tokens.
El desafío de la alucinación y cómo mitigarlo.
Práctica con IA: Usa Continue.dev para consultar un modelo local (Ollama) y otro remoto (DeepSeek), compara sus respuestas y analiza diferencias de estilo y precisión.

Ingeniería de Prompts (Prompt Engineering)🔗

Estructura de un prompt: sistema, usuario, asistentes, contexto.
Técnicas: few-shot, chain-of-thought, ReAct.
System prompts: definiendo el rol y las reglas del modelo.
Formato de salida estructurado: JSON mode, function calling.
Práctica con IA: Prompt socrático: "Diseña un prompt que convierta texto libre en SQL. La IA revisa tu prompt y te pregunta qué casos frontera no estás cubriendo."

APIs de Modelos🔗

OpenAI API: chat completions, embeddings, streaming.
Anthropic Claude API: mensajes, herramientas, manejo de contexto largo.
Modelos abiertos vía Ollama y OpenRouter.
Costos, límites de tasa y manejo de errores.
Práctica con IA: Construye un cliente en Python que consuma el mismo programa con OpenAI y Ollama, intercambiando el backend. La IA ayuda a abstraer la interfaz.

Embeddings y Bases de Datos Vectoriales🔗

¿Qué es un embedding y cómo se genera?
Similitud coseno y búsqueda semántica.
ChromaDB: base de datos vectorial embebida.
Qdrant / Pinecone / Weaviate (visión general).
Práctica con IA: Genera embeddings de documentos reales (PDFs, Markdown) y la IA te guía en la elección del modelo de embedding según el idioma y dominio.

RAG (Retrieval-Augmented Generation)🔗

Arquitectura RAG: ingestión → indexación → recuperación → generación.
Chunking estratégico: tamaño, solapamiento, splitting semántico.
LangChain: cadenas, retrievers, document loaders.
Evaluación de RAG: fidelidad, relevancia, recall.
Práctica con IA: Construye un RAG que responda preguntas sobre la documentación de ByteLabs. La IA revisa los chunks generados y sugiere mejoras de chunking.

LangChain Avanzado🔗

Chains: secuencias de llamadas al modelo.
Memory: buffers de conversación, ventanas, resúmenes.
Tools: darle al modelo la capacidad de ejecutar código, buscar en la web, consultar APIs.
LangChain Expression Language (LCEL).
Práctica con IA: Construye un chatbot que recuerde la conversación y pueda ejecutar comandos de sistema. La IA actúa como revisor de seguridad.

Agentes con IA🔗

¿Qué es un agente? — razonamiento + acciones.
Frameworks: LangChain Agents, CrewAI, AutoGen.
Herramientas personalizadas: envolturas de APIs y código.
Ejecución con supervisión humana (human-in-the-loop).
Práctica con IA: Prompt para diseñar un agente que investigue un tema: busque en la web, resuma en un archivo y envíe un correo. La IA revisa la arquitectura por seguridad.

Fine-Tuning y RAG vs Fine-Tuning🔗

¿Cuándo hacer fine-tuning vs cuándo usar RAG?
LoRA / QLoRA: fine-tuning eficiente en parámetros.
Datasets de entrenamiento: formato, calidad, aumentación.
Evaluación de modelos fine-tuned.
Práctica con IA: El asistente analiza un caso de uso real del alumno y recomienda si debe usar RAG, fine-tuning o ambos, justificando cada decisión.

Evaluación y monitoreo en producción🔗

Métricas: BLEU, ROUGE, BERTScore, LLM-as-a-Judge.
Evaluación automática con cadenas de evaluación.
Monitoreo: latencia, costos, tasas de error, alucinaciones.
Guardrails: prevenir salidas no deseadas con NeMo Guardrails o Guardrails AI.
Práctica con IA: Construye un evaluador automático que use un LLM para calificar las respuestas de otro LLM. La IA analiza los falsos positivos del evaluador.

Temas selectos (opcionales)🔗

Multimodalidad: procesar imágenes con GPT-4o / Claude 3.5.
Text-to-Speech y Speech-to-Text (Whisper, ElevenLabs).
Construcción de asistentes por voz.
Open-source local con Ollama + Open WebUI.
Ética y sesgos en IA generativa.
Práctica con IA: Ingeniería de prompts: "Diseña un asistente de voz que tome pedidos de un restaurante. La IA te guía en la arquitectura de agentes y manejo de contexto."

🎯 Proyecto final del curso

Construirás un asistente RAG completo que responda preguntas sobre documentación técnica (PDFs, Markdown) usando LangChain + ChromaDB + OpenAI/DeepSeek, con interfaz web en Streamlit, chunking estratégico, evaluación de fidelidad y relevancia, y despliegue en producción con monitoreo.

🚀 Este curso te prepara para

Ingeniero de Prompts Desarrollador de Aplicaciones con IA Arquitecto de Soluciones RAG Especialista en Integración de LLMs Desarrollador Full-Stack con IA