3 niveles de profundidad. Modalidad 100% virtual con instructor en vivo. Certificado oficial del Ministerio del Trabajo del Ecuador al aprobar.
3 pasos simples · acceso en menos de 12 horas tras confirmar el pago
Acepta Pichincha, Bolivariano, Guayaquil, Banco del Pacífico y otros bancos. Transferencia interbancaria sin recargo desde Produbanco.
Mándanos foto o PDF del comprobante de transferencia por WhatsApp con tu nombre completo, número de cédula y nivel del curso (Express / Estándar / Completo).
📲 Enviar comprobante por WhatsAppTe entregamos:
tecnologico.itseia.ai¿Tienes preguntas antes de pagar?
💬 Conversar con asesor por WhatsApp3 niveles del mismo curso · cada uno con más profundidad y proyectos. Pulsa "Ver contenido" para ver módulos, herramientas y salida laboral.
Operador: ITSEIA ACADEMY S.A.S. (RUC 1793233739001)
Coordinador Pedagógico: Héctor Bolívar Velasco Álvarez
Modalidad: Virtual · Área MDT: 06 — Informática y Comunicación
Estructura: 4 módulos × 5 temas × 2 horas por tema = 40h totales
Formar a los participantes en los fundamentos teóricos y prácticos del Machine Learning supervisado aplicado a contextos empresariales, capacitándolos para construir y evaluar modelos de regresión y clasificación que resuelvan problemas reales de negocio como predicción de ventas, detección de fraude y clasificación de clientes, utilizando Python y Scikit-learn. El participante cubre el ciclo completo de ML supervisado: preparación de datos, modelado, evaluación y presentación de resultados con impacto de negocio.
| # | Tema | Horas | Lo que vas a aprender |
|---|---|---|---|
| 1.1 | Qué es el Machine Learning y cómo lo usan las empresas ecuatorianas | 2h | Definición de ML y diferencia con la IA tradicional; tipos de ML: supervisado, no supervisado y por refuerzo; casos reales en Ecuador: Banco Pichincha en scoring crediticio, Corporación Favorita en predicción de demanda, telecomunicaciones en predicción de churn; ecosistema ML en Python con Scikit-learn |
| 1.2 | Ciclo de vida de un proyecto de ML | 2h | Las 7 fases de un proyecto de ML: pregunta de negocio, datos, preparación, modelado, evaluación, interpretación y presentación; cómo se diferencia el trabajo de un científico de datos del de un analista; documentación de decisiones en cada fase; herramientas del ecosistema ML en Python |
| 1.3 | Preparación de datos para modelado | 2h | División de datos en train/test/validation y por qué es crítico hacerlo bien; técnicas de muestreo: estratificado para clases desbalanceadas; encoding de variables categóricas: Label Encoding y One-Hot Encoding; feature scaling: por qué algunos algoritmos lo requieren; ejercicio práctico: preparar un dataset de clientes ecuatorianos para el primer modelo |
| 1.4 | Métricas de evaluación de modelos | 2h | Métricas para regresión: RMSE, MAE, R², MAPE — cuál usar según el contexto de negocio; métricas para clasificación: accuracy, precision, recall, F1-score — cuál priorizar según el costo del error; matrices de confusión: cómo leerlas y qué significan para el negocio; curvas ROC/AUC: interpretación para audiencias no técnicas |
| 1.5 | Sesgo vs. varianza, overfitting y validación cruzada | 2h | El dilema sesgo-varianza explicado con ejemplos de negocio; qué es el overfitting y por qué destruye los modelos en producción; validación cruzada k-fold para estimar el rendimiento real; cómo saber si tu modelo generalizará bien a datos nuevos; ejercicio práctico: detectar y corregir overfitting en un modelo de clasificación |
| # | Tema | Horas | Lo que vas a aprender |
|---|---|---|---|
| 2.1 | Regresión lineal simple y múltiple | 2h | Concepto de regresión y cuándo usarla; regresión lineal simple con una variable predictora; regresión múltiple con varias variables; interpretación de coeficientes en lenguaje de negocio; supuestos del modelo lineal y cómo verificarlos; ejercicio: primer modelo de regresión con datos de ventas ecuatorianas |
| 2.2 | Regularización: Ridge, Lasso y ElasticNet | 2h | Por qué la regresión lineal simple se sobreajusta con muchas variables; Ridge (L2): penaliza coeficientes grandes; Lasso (L1): elimina variables irrelevantes automáticamente; ElasticNet: combinación de Ridge y Lasso; cuándo usar cada uno en proyectos de negocio; ejercicio práctico: predicción de precios de arriendo en Quito con regularización |
| 2.3 | Feature engineering para mejorar modelos | 2h | Creación de nuevas variables a partir de las existentes; interacciones entre variables; variables polinómicas para capturar relaciones no lineales; variables de fecha: mes, día de la semana, temporada; ejercicio práctico: mejorar el modelo de predicción de ventas con feature engineering contextualizado en Ecuador (feriados, temporadas) |
| 2.4 | Evaluación y diagnóstico de modelos de regresión | 2h | Análisis de residuos: distribución, homocedasticidad, autocorrelación; gráficos de diagnóstico: residuos vs. valores ajustados, QQ-plot; detección de puntos de influencia (outliers que distorsionan el modelo); cómo presentar el rendimiento de un modelo a una audiencia de negocio con RMSE en unidades reales |
| 2.5 | Proyecto de regresión: predicción de ventas retail Ecuador | 2h | Construcción completa de un modelo de predicción de ventas mensuales para empresa retail ecuatoriana; feature engineering con estacionalidad y feriados del Ecuador (Navidad, Carnaval, Semana Santa); evaluación con RMSE objetivo menor al 15% de la venta promedio; presentación ejecutiva del modelo con impacto económico cuantificado |
| # | Tema | Horas | Lo que vas a aprender |
|---|---|---|---|
| 3.1 | Regresión logística y árboles de decisión | 2h | Regresión logística: el modelo de clasificación de referencia; por qué empezar siempre con el modelo más simple; árboles de decisión: interpretables y visualizables para directivos; profundidad máxima y criterios de parada; visualización del árbol con sklearn; ejercicio: clasificador de riesgo crediticio básico |
| 3.2 | Random Forest y métodos de ensemble básicos | 2h | Por qué un bosque de árboles aleatorios supera a un solo árbol; bagging: la idea detrás de Random Forest; feature importance: cómo saber qué variables importan más; manejo nativo de valores faltantes y variables categóricas; ejercicio: detector de transacciones fraudulentas con Random Forest sobre datos del sistema financiero ecuatoriano |
| 3.3 | Support Vector Machines, KNN y Naive Bayes | 2h | SVM: el hiperplano que separa clases — cuándo usarlo; K-Nearest Neighbors: el clasificador por vecindad — ventajas y limitaciones; Naive Bayes: velocidad y eficiencia para texto y categorías; cuándo elegir cada algoritmo según el tipo de problema y el volumen de datos |
| 3.4 | Matrices de confusión, ROC/AUC y selección de modelo | 2h | Matriz de confusión completa: TP, TN, FP, FN; precision vs. recall: cuándo priorizar cada uno según el costo del error en el negocio; curva ROC y AUC para comparar modelos sin depender del umbral; selección del mejor modelo según el costo del error de negocio: ¿qué es peor, un falso positivo o un falso negativo? |
| 3.5 | Proyecto de clasificación: scoring crediticio en cooperativas Ecuador | 2h | Construcción de un clasificador de riesgo crediticio con datos representativos de cooperativas ecuatorianas de ahorro y crédito (SEPS); comparativa árbol de decisión vs. Random Forest; análisis completo de curva ROC/AUC; objetivo: F1-score mayor a 0.75; presentación ejecutiva con recomendación justificada del modelo para implementar |
| # | Tema | Horas | Lo que vas a aprender |
|---|---|---|---|
| 4.1 | Definición del problema y métricas de éxito | 2h | Cómo convertir una pregunta de negocio en un proyecto de ML; definición de la métrica de éxito del modelo en términos de negocio (no solo de estadística); identificación de datos disponibles y sus limitaciones; planificación del proyecto en 5 etapas con tiempos estimados |
| 4.2 | Preparación del dataset y análisis exploratorio | 2h | Limpieza y preparación del dataset del proyecto final; EDA específico para ML: distribuciones, correlaciones, desbalance de clases; feature engineering inicial; estrategia de validación: train/test split o validación cruzada según el tamaño del dataset |
| 4.3 | Modelado baseline y comparativa de algoritmos | 2h | Construcción del modelo baseline (siempre empezar por el más simple); implementación de al menos 2 algoritmos adicionales; comparativa sistemática con métricas consistentes; análisis de errores: dónde falla cada modelo y por qué; selección del mejor modelo con justificación técnica |
| 4.4 | Interpretación de resultados con impacto de negocio | 2h | Traducción de las métricas del modelo a impacto de negocio cuantificado (USD, tiempo, reducción de errores); feature importance para comunicar qué variables son más relevantes; gráficos interpretables para audiencias directivas; cálculo del ROI esperado de la implementación del modelo |
| 4.5 | Presentación ejecutiva del proyecto ante la clase | 2h | Estructura de la presentación de resultados de ML para directivos: problema, datos, modelo, resultados, recomendación; presentación de 10 minutos ante la clase con retroalimentación del instructor; documentación del notebook con markdown profesional; próximos pasos para llevar el modelo a producción |
| # | Proyecto | Dataset / Fuente | Métrica de éxito | Entregable |
|---|---|---|---|---|
| 1 | Predicción de ventas mensuales — empresa retail Ecuador | Datos de ventas con estacionalidad y feriados ecuatorianos (Navidad, Carnaval, Semana Santa) | RMSE menor al 15% de la venta promedio mensual | Modelo de regresión documentado + informe de coeficientes en lenguaje de negocio |
| 2 | Clasificador de riesgo crediticio en cooperativas | Datos representativos de cooperativas de ahorro y crédito (estructura SEPS) | F1-score mayor a 0.75 con análisis ROC/AUC completo | Comparativa árbol de decisión vs. Random Forest con recomendación justificada |
| 3 | Proyecto final a elección: churn, fraude o segmentación | Datos propios del participante o dataset de Kaggle sobre el sector elegido | Impacto económico estimado cuantificado en USD + métricas técnicas documentadas | Notebook Jupyter + presentación ejecutiva de 10 diapositivas ante la clase |
| 4 | Contextualización Ecuador: análisis de caso real | Banco Pichincha, Produbanco o cooperativas del sector financiero ecuatoriano | Propuesta de mejora del modelo actual basada en los algoritmos del curso | Informe de 1 página con oportunidad identificada y mejora propuesta con ROI estimado |
| Herramienta | Versión 2026 | Para qué |
|---|---|---|
| Scikit-learn | 1.5+ | Framework ML completo: API consistente para todos los modelos |
| Pandas + NumPy | 2.x / 2.x | Preparación y manipulación de datos para ML |
| Matplotlib + Seaborn | 3.x / 0.13+ | Visualización de resultados y curvas ROC |
| Jupyter Notebook / Google Colab | 2026 | Entorno interactivo de experimentación y documentación |
| GitHub | 2026 | Control de versiones y portafolio de proyectos |
| Kaggle | 2026 | Datasets públicos y benchmarking de modelos |
Formato: 60% sesiones sincrónicas en vivo con live-coding + 40% práctica asincrónica en notebooks con datos Ecuador
Distribución de la evaluación:
| Componente | Peso |
|---|---|
| Módulo 1: Quiz conceptual de ML y ejercicios de preparación de datos | 15% |
| Módulo 2: Proyecto de regresión con métricas documentadas y presentación de negocio | 25% |
| Módulo 3: Proyecto de clasificación con análisis comparativo de modelos | 30% |
| Módulo 4: Proyecto final aplicado (propuesta, desarrollo, presentación ejecutiva) | 20% |
| Participación activa en sesiones sincrónicas y foros asincrónicos | 10% |
| **TOTAL** | **100%** |
| Rol | Salario inicial | Senior | Empresas |
|---|---|---|---|
| Científico de Datos Junior (ML) | $1,500/mes | $2,500/mes | Banco Pichincha, Produbanco, cooperativas de ahorro |
| Analista de Modelos Predictivos | $1,200/mes | $2,000/mes | Corporación Favorita, Claro, Movistar |
| Especialista en ML (freelance) | $40/hora | $80/hora | PYMEs, exportadoras, startups tech |
| Analista de Riesgo con ML (banca) | $1,400/mes | $2,200/mes | Bancos privados, aseguradoras, fintech Ecuador |
Sectores con mayor demanda: banca y finanzas (scoring crediticio, detección de fraude), telecomunicaciones (predicción de churn), retail (predicción de demanda), agroindustria (rendimiento de cultivos).
Categoría Corta 40h · Avalado por el Ministerio del Trabajo del Ecuador
Operador: ITSEIA ACADEMY S.A.S. · RUC 1793233739001
Modalidad: Virtual · Área: 06 — Informática y Comunicación
| # | Referencia |
|---|---|
| 1 | Géron, A. (2022). Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow (3.a ed.). O'Reilly Media. |
| 2 | Scikit-learn developers (2025). Documentación oficial de Scikit-learn 1.5. https://scikit-learn.org/stable/ |
| 3 | SEPS (2026). Estadísticas del sector cooperativista ecuatoriano. https://www.seps.gob.ec/ |
| 4 | Aprender21 (2026). Salario ML engineer Ecuador $50,000/año promedio. https://www.aprender21.com/blog/inteligencia-artificial-ecuador-guia-2026 |
| 5 | Nucamp (2026). Top 10 empresas tech Ecuador: Banco Pichincha, Globant. https://www.nucamp.co/blog/coding-bootcamp-ecuador-ecu-top-10-tech-companies-to-work-for-in-ecuador-in-2025 |
*ITSEIA ACADEMY S.A.S. — Instituto Ecuatoriano de Inteligencia Artificial*
*itseia.ai · administracion@itseia.ai · WhatsApp 0997489821*
*Inscripciones: itseia.ai/cursos · Abril 2026*
Operador: ITSEIA ACADEMY S.A.S. (RUC 1793233739001)
Coordinador Pedagógico: Héctor Bolívar Velasco Álvarez
Modalidad: Virtual · Área MDT: 06 — Informática y Comunicación
Estructura: 6 módulos × 5 temas × 2 horas por tema = 60h totales
Desarrollar competencias sólidas en Machine Learning aplicado a problemas reales de negocios ecuatorianos, construyendo y evaluando modelos predictivos de regresión, clasificación, clustering y series temporales con el stack profesional 2026: Scikit-learn 1.5, XGBoost, LightGBM, Optuna y Prophet. El participante egresa capaz de seleccionar el algoritmo más adecuado para cada tipo de problema empresarial, optimizar hiperparámetros de forma sistemática, interpretar los resultados con herramientas de explicabilidad (SHAP) y presentar el impacto de negocio de sus modelos a audiencias ejecutivas no técnicas.
| # | Tema | Horas | Lo que vas a aprender |
|---|---|---|---|
| 1.1 | ML en empresas ecuatorianas: casos reales y ecosistema | 2h | Por qué empresas ecuatorianas ya usan ML: Banco Pichincha en fraude, Corporación Favorita en predicción de demanda, Claro en predicción de churn; tipos de ML: supervisado, no supervisado, por refuerzo; ciclo de vida de un proyecto de ML en una empresa desde la pregunta de negocio hasta la recomendación accionable |
| 1.2 | Preparación del entorno profesional de ML | 2h | Anaconda, Jupyter Notebook, Google Colab; instalación de Scikit-learn, XGBoost, LightGBM, SHAP y Optuna; configuración de un proyecto de ML con estructura de carpetas; primer notebook de ML configurado y listo para trabajar |
| 1.3 | División de datos y validación cruzada | 2h | Train/test/validation split: por qué el orden importa en datos con temporalidad; estratificación para clases desbalanceadas; validación cruzada k-fold: cómo estimar el rendimiento real del modelo; fuga de datos (data leakage): el error más caro y cómo evitarlo; ejercicio práctico: dividir correctamente un dataset de churn ecuatoriano |
| 1.4 | Métricas de evaluación según el problema de negocio | 2h | Métricas de regresión: RMSE, MAE, R², MAPE en unidades de negocio; métricas de clasificación: accuracy, precision, recall, F1-score — cuál usar según el costo del error; AUC-ROC para comparar modelos independientemente del umbral; cómo presentar métricas técnicas a directivos sin que los aburran |
| 1.5 | Scikit-learn: la API consistente del ecosistema ML | 2h | Por qué Scikit-learn sigue siendo el estándar para datos tabulares en 2026; filosofía fit/transform/predict: cambiar de modelo es cambiar una línea de código; Pipelines de Scikit-learn para evitar fuga de datos; ColumnTransformer para preprocesar diferentes tipos de columnas; construcción del primer pipeline de ML completo |
| # | Tema | Horas | Lo que vas a aprender |
|---|---|---|---|
| 2.1 | Regresión lineal: supuestos, implementación y diagnóstico | 2h | Regresión lineal simple y múltiple; supuestos del modelo lineal: linealidad, homocedasticidad, independencia; análisis de residuos para detectar violaciones; interpretación de coeficientes en lenguaje de negocio; ejercicio: predicción de precios de arriendo de vivienda en Quito por sector (Cumbayá, Norte, Sur, Valle de los Chillos) |
| 2.2 | Regularización: Ridge, Lasso y ElasticNet | 2h | Por qué la regresión lineal falla con muchas variables; Ridge (L2): reduce todos los coeficientes sin eliminarlos; Lasso (L1): selección automática de variables relevantes; ElasticNet: combinación óptima; ejercicio práctico: regularización sobre dataset de exportaciones ecuatorianas (banano, camarón, flores) con múltiples variables |
| 2.3 | Feature engineering para regresión | 2h | Creación de variables derivadas: ratios, diferencias y porcentajes; variables de temporalidad: mes, trimestre, año, feriados Ecuador (Navidad, Carnaval, Semana Santa, feriados locales); regresión polinómica para relaciones no lineales; ejercicio: mejorar el modelo de predicción de ventas con variables de calendario ecuatoriano |
| 2.4 | Implementación completa con Scikit-learn Pipeline | 2h | Pipeline con preprocesamiento + modelo: StandardScaler, OneHotEncoder, GridSearchCV integrados; por qué el Pipeline evita la fuga de datos de validación; validación cruzada dentro del Pipeline; exportación del Pipeline entrenado para reutilización; ejercicio: Pipeline completo para predicción de demanda de exportaciones |
| 2.5 | Proyecto de regresión: predicción de ventas con impacto de negocio | 2h | Pronóstico de ventas mensuales de empresa retail ecuatoriana: construcción completa del modelo, análisis de errores por período y región, presentación de resultados con RMSE en unidades de negocio (soles/cajas/unidades); cálculo del ahorro en inventario por reducción del error de pronóstico; presentación ante la clase |
| # | Tema | Horas | Lo que vas a aprender |
|---|---|---|---|
| 3.1 | Regresión logística y árboles de decisión | 2h | Regresión logística: el modelo de referencia para clasificación binaria; cuándo la regresión logística es suficiente y cuándo no; árboles de decisión: visualización completa del proceso de decisión para directivos; profundidad máxima, criterio de split y poda; ejercicio: clasificador de mora en créditos de cooperativas ecuatorianas |
| 3.2 | Random Forest: el modelo robusto de producción | 2h | Por qué Random Forest supera a los árboles individuales; bagging y aleatoriedad de features; importancia de variables (feature importance): comunicar qué factores importan más al negocio; manejo nativo de desbalance de clases; ejercicio: detector de transacciones fraudulentas en el sistema financiero ecuatoriano con análisis de feature importance |
| 3.3 | SVM, KNN y Naive Bayes | 2h | Support Vector Machines: el hiperplano de margen máximo — cuándo usar con kernel RBF; K-Nearest Neighbors: clasificación por vecindad — sensibilidad al número de vecinos K; Naive Bayes: eficiencia para clasificación de texto y datos categóricos; comparativa de velocidad de entrenamiento e inferencia en datasets de tamaño empresarial ecuatoriano |
| 3.4 | Matrices de confusión y umbral de decisión óptimo | 2h | Matriz de confusión completa con interpretación de negocio; precision vs. recall: el tradeoff clave — ¿qué es más caro para el negocio, un falso positivo o un falso negativo?; curva Precision-Recall para clases desbalanceadas; curva ROC/AUC para comparar modelos; selección del umbral de decisión óptimo según el costo del error de negocio (fraude bancario: ¿bloquear transacciones legítimas o dejar pasar fraude?) |
| 3.5 | Proyecto de clasificación: predicción de churn en telecomunicaciones | 2h | Predicción de abandono de clientes (churn) en empresa de telecomunicaciones ecuatoriana; comparativa completa: Regresión Logística vs. Árbol de Decisión vs. Random Forest; análisis ROC/AUC comparativo; selección del umbral de decisión óptimo; propuesta de estrategia de retención por segmento con costo estimado y ROI proyectado |
| # | Tema | Horas | Lo que vas a aprender |
|---|---|---|---|
| 4.1 | K-Means y método del codo para clustering | 2h | Concepto de clustering: agrupar sin etiquetas; K-Means: el algoritmo más usado en marketing; método del codo (elbow method) para elegir el número óptimo de clusters K; silhouette score para evaluar la calidad del clustering; ejercicio: segmentación inicial de clientes de empresa retail ecuatoriana |
| 4.2 | DBSCAN, clustering jerárquico y evaluación | 2h | DBSCAN: clusters de forma irregular y detección automática de ruido/outliers; clustering jerárquico con dendrogramas: cuándo usarlo; comparativa K-Means vs. DBSCAN vs. jerárquico; silhouette analysis para evaluar y comparar métodos; ejercicio: detección de anomalías en datos de transacciones financieras |
| 4.3 | Reducción de dimensionalidad con PCA y t-SNE | 2h | Por qué reducir dimensiones: el problema de la maldición de la dimensionalidad; PCA (Análisis de Componentes Principales): proyección lineal, varianza explicada, visualización 2D de datos multidimensionales; t-SNE para visualización no lineal de clusters; ejercicio: visualización de segmentos de clientes en 2D con PCA |
| 4.4 | Segmentación RFM: el estándar del retail ecuatoriano | 2h | Análisis RFM (Recencia, Frecuencia, Monto): el modelo estándar para segmentación de clientes; construcción de la segmentación RFM con K-Means; identificación de al menos 4 segmentos accionables: VIP, en riesgo, nuevos de potencial e inactivos; propuesta de campaña de marketing diferenciada por segmento con presupuesto y ROI estimado |
| 4.5 | Detección de anomalías e interpretación de segmentos | 2h | Isolation Forest para detección de anomalías multivariable; reglas de asociación con Apriori: "quienes compran X también compran Y" — market basket analysis para retail ecuatoriano; interpretación de segmentos en términos de negocio; presentación de la segmentación ante directivos: cómo hacer accionable el clustering |
| # | Tema | Horas | Lo que vas a aprender |
|---|---|---|---|
| 5.1 | Gradient Boosting: XGBoost en producción empresarial | 2h | Por qué los métodos ensemble ganan en datos tabulares; Bagging vs. Boosting: la diferencia fundamental; Gradient Boosting: la idea de corregir errores iterativamente; XGBoost: el modelo más usado en producción empresarial; implementación completa con XGBoost sobre datos de churn ecuatoriano |
| 5.2 | LightGBM y CatBoost: velocidad y variables categóricas | 2h | LightGBM: entrenamiento 13x más rápido que XGBoost en datasets con millones de filas (benchmark Microsoft Research con 119M de filas); CatBoost: manejo nativo de variables categóricas sin encoding manual; cuándo usar XGBoost, LightGBM o CatBoost según el proyecto; comparativa de velocidad y métricas en dataset ecuatoriano de alto volumen |
| 5.3 | Optuna: optimización automática de hiperparámetros | 2h | Por qué la búsqueda manual de hiperparámetros no escala; Grid Search y Random Search: sus limitaciones; Optuna: búsqueda bayesiana con pruning inteligente (elimina experimentos malos temprano); configuración del espacio de búsqueda para XGBoost y LightGBM; ejercicio práctico: optimizar el modelo de churn con Optuna hasta superar el baseline |
| 5.4 | SHAP: explicabilidad de modelos para directivos | 2h | Por qué la explicabilidad es crítica para reguladores y directivos en 2026; SHAP (SHapley Additive exPlanations): teoría de juegos aplicada a ML; gráficos de barras de feature importance global con SHAP; gráficos de fuerza para explicar predicciones individuales; beeswarm plots para el impacto de cada variable; caso práctico: explicar qué lleva a un cliente a hacer churn en telecomunicaciones Ecuador |
| 5.5 | Pipeline completo XGBoost + Optuna + SHAP con datos Ecuador | 2h | Construcción del pipeline completo: preprocesamiento → XGBoost → Optuna → SHAP → informe ejecutivo; predicción de churn en empresa de telecomunicaciones ecuatoriana; análisis SHAP completo con gráficos listos para presentar a directivos; recomendación de estrategia de retención basada en los factores más influyentes identificados por SHAP |
| # | Tema | Horas | Lo que vas a aprender |
|---|---|---|---|
| 6.1 | Componentes de series temporales y modelos estadísticos | 2h | Componentes: tendencia, estacionalidad, ciclo y ruido; descomposición con statsmodels; estacionariedad y test ADF; modelos ARIMA: identificación de parámetros p, d, q con ACF y PACF; SARIMA para estacionalidad múltiple; ejercicio: decomposición de series de ventas de empresa ecuatoriana |
| 6.2 | ARIMA calibrado sobre datos reales de Ecuador | 2h | Calibración de ARIMA sobre ventas semanales de cadena de distribución ecuatoriana; validación con walk-forward (simulación de producción real); métricas temporales: MAE, RMSE, MAPE; identificación de las semanas con mayor error (feriados, temporadas); interpretación de los resultados para el equipo de inventarios |
| 6.3 | Prophet (Meta): pronóstico robusto con feriados Ecuador | 2h | Por qué Prophet fue diseñado para el mundo real: robusto a outliers, días faltantes y cambios de tendencia; configuración del componente de feriados con calendario ecuatoriano oficial (Navidad, Año Nuevo, Carnaval, Semana Santa, Día del Trabajo, independencias, feriados locales); visualización automática de componentes; Prophet vs. ARIMA: cuándo usar cada uno |
| 6.4 | Comparativa ARIMA vs. Prophet y proyección de inventarios | 2h | Evaluación comparativa de ARIMA vs. Prophet sobre el mismo dataset de ventas ecuatoriano; selección del modelo con mejor MAPE y justificación; proyección de inventario óptimo para reducción de merma: cuánto producto pedir cada semana según el pronóstico; cálculo del ahorro en merma en USD para la empresa |
| 6.5 | Proyecto integrador end-to-end: ciclo completo de ML en un negocio Ecuador | 2h | El participante aplica el ciclo completo de ML a un problema de negocio real de su sector (banca, retail, salud, agro o telecomunicaciones); desde la preparación de datos hasta el pitch ejecutivo de resultados; pitch de 10 minutos ante la clase con: problema, modelo elegido, métricas técnicas, impacto de negocio cuantificado en USD y recomendación accionable |
| # | Proyecto | Dataset / Fuente | Métrica de éxito | Entregable |
|---|---|---|---|---|
| 1 | Predicción de precios de vivienda en Quito | Portales inmobiliarios ecuatorianos: sector, m2, habitaciones, parqueaderos | R² mayor a 0.75 con análisis de errores por zona | Modelo interpretable + informe de coeficientes en lenguaje de negocio |
| 2 | Detector de transacciones fraudulentas | Datos representativos del sistema financiero ecuatoriano (estructura bancaria) | AUC mayor a 0.90 + recomendación de umbral justificada en costo de negocio | Clasificador Random Forest vs. XGBoost con análisis ROC/AUC completo |
| 3 | Segmentación RFM de clientes retail ecuatoriano | Datos de transacciones de empresa retail Ecuador (datos del curso) | Al menos 4 segmentos accionables con propuesta de campaña y ROI proyectado | Mapa de segmentos con PCA 2D + recomendaciones de acción por segmento |
| 4 | Predicción de churn con XGBoost + Optuna + SHAP | Datos de telecomunicaciones ecuatorianas (estructura de empresa local) | Pipeline optimizado con Optuna + análisis SHAP con 5 variables más influyentes | Notebook documentado + análisis SHAP listo para directivos + estrategia de retención |
| 5 | Pronóstico de ventas: ARIMA vs. Prophet con feriados Ecuador | Ventas semanales de cadena de distribución ecuatoriana + calendario feriados oficiales | Modelo seleccionado con MAPE justificado + ahorro en merma cuantificado en USD | Comparativa técnica + proyección de inventario óptimo + pitch ejecutivo de impacto |
| Herramienta | Versión 2026 | Para qué |
|---|---|---|
| Scikit-learn | 1.5+ | Framework ML completo, API consistente para todos los modelos |
| XGBoost | 2.x | Gradient boosting de alto rendimiento, más usado en producción |
| LightGBM | 4.x | Entrenamiento 13x más rápido en datasets grandes |
| CatBoost | 1.x | Variables categóricas sin encoding, competitivo con XGBoost |
| Optuna | 3.x | Optimización automática de hiperparámetros con pruning inteligente |
| SHAP | 0.45+ | Explicabilidad global y local de cualquier modelo |
| LIME | 0.2+ | Explicaciones locales de predicciones individuales |
| Prophet (Meta) | 1.1+ | Pronóstico temporal con feriados Ecuador incorporados |
| statsmodels (ARIMA/SARIMA) | 0.14+ | Modelos estadísticos clásicos para series temporales |
| Pandas + Polars | 2.x / 1.x | Preparación y manipulación de datos para ML |
| Matplotlib + Seaborn | 3.x / 0.13+ | Visualización de resultados de modelos |
| GitHub + Kaggle | 2026 | Portafolio y benchmarking con la comunidad global de ML |
Formato: 60% sesiones sincrónicas en vivo con live-coding + 40% práctica asincrónica con notebooks de proyectos sobre datos Ecuador
Distribución de la evaluación:
| Componente | Peso |
|---|---|
| Módulo 1: Quiz de fundamentos ML + configuración del entorno | 5% |
| Módulo 2: Modelo de regresión sobre datos Ecuador (R² objetivo >0.75) | 15% |
| Módulo 3: Clasificador con análisis ROC/AUC comparativo y umbral de decisión | 15% |
| Módulo 4: Segmentación RFM con clustering + propuesta de marketing accionable | 15% |
| Módulo 5: Pipeline XGBoost + Optuna con análisis SHAP interpretable | 15% |
| Módulo 6: Pronóstico series temporales + proyecto integrador end-to-end | 25% |
| Participación activa en sesiones sincrónicas y foros asincrónicos | 10% |
| **TOTAL** | **100%** |
| Rol | Salario inicial | Senior | Empresas |
|---|---|---|---|
| Científico de Datos Junior-Medio | $1,000/mes | $3,500/mes | Banco Pichincha, Produbanco, Globant Ecuador |
| Ingeniero de Machine Learning | $1,200/mes | $4,500/mes | Empresas tecnología, sector financiero |
| Analista de Riesgo con ML | $1,100/mes | $3,500/mes | Bancos, aseguradoras, cooperativas de ahorro |
| Especialista en Predicción de Demanda | $900/mes | $2,800/mes | Corporación Favorita, distribuidoras, exportadoras |
| ML Engineer remoto para LATAM | $2,000/mes | $6,000/mes | Empresas extranjeras con talento Ecuador |
Los ingenieros de ML en Ecuador ganan en promedio alrededor de $50,000 USD anuales ($4,000/mes), con Banco Pichincha pagando $4,500-$6,500/mes a nivel senior y Globant hasta $8,500/mes en roles de lead (aprender21.com 2026, nucamp.co 2026). El dominio de XGBoost, SHAP y Prophet es el diferenciador más consistente en el mercado.
Categoría Corta 60h · Avalado por el Ministerio del Trabajo del Ecuador
Operador: ITSEIA ACADEMY S.A.S. · RUC 1793233739001
Modalidad: Virtual · Área: 06 — Informática y Comunicación
| # | Referencia |
|---|---|
| 1 | Géron, A. (2022). Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow (3.a ed.). O'Reilly Media. |
| 2 | LightGBM 13x más rápido que XGBoost en 119M filas (benchmark Microsoft Research): https://www.spaceo.ai/blog/machine-learning-tech-stack/ |
| 3 | Aprender21 (2026). Salario ML engineer Ecuador $50,000/año promedio: https://www.aprender21.com/blog/inteligencia-artificial-ecuador-guia-2026 |
| 4 | Nucamp (2026). Top 10 tech companies Ecuador: Banco Pichincha $4,500-$6,500/mes, Globant $8,500/mes lead: https://www.nucamp.co/blog/coding-bootcamp-ecuador-ecu-top-10-tech-companies-to-work-for-in-ecuador-in-2025 |
| 5 | SEPS (2026). Estadísticas del cooperativismo ecuatoriano: https://www.seps.gob.ec/ |
| 6 | Scikit-learn 2026 sigue siendo referencia para fraud detection, churn y scoring: https://scale.jobs/blog/top-ml-frameworks-job-seekers |
*ITSEIA ACADEMY S.A.S. — Instituto Ecuatoriano de Inteligencia Artificial*
*itseia.ai · administracion@itseia.ai · WhatsApp 0997489821*
*Inscripciones: itseia.ai/cursos · Abril 2026*
Operador: ITSEIA ACADEMY S.A.S. (RUC 1793233739001)
Coordinador Pedagógico: Héctor Bolívar Velasco Álvarez
Modalidad: Virtual · Área MDT: 06 — Informática y Comunicación
Estructura: 8 módulos × 5 temas × 2 horas por tema = 80h totales
Completar la formación integral en Machine Learning incorporando el despliegue de modelos en producción mediante APIs REST con FastAPI, la trazabilidad de experimentos con MLflow, introducción a Docker y los conceptos fundamentales de MLOps, la construcción de un portafolio GitHub profesional con proyectos documentados y APIs demostrables, y la resolución de un caso de negocio real de una empresa del ecosistema ITSEIA con mentoría 1:1. El participante egresa con el ciclo completo de ML dominado: desde la pregunta de negocio hasta una API de predicción funcional en producción, con un portafolio público verificable y experiencia en un proyecto empresarial real ecuatoriano.
| # | Tema | Horas | Lo que vas a aprender |
|---|---|---|---|
| 1.1 | ML en empresas ecuatorianas y ecosistema profesional | 2h | Casos reales: Banco Pichincha en fraude, Corporación Favorita en demanda, Claro en churn; tipos de ML; ciclo de vida de un proyecto en una empresa ecuatoriana; entorno: Anaconda, Jupyter, Google Colab, librerías del stack completo |
| 1.2 | Scikit-learn: la API consistente del ecosistema ML | 2h | Filosofía fit/transform/predict; cambiar de modelo con una línea de código; Pipelines para evitar fuga de datos; ColumnTransformer para columnas heterogéneas; primer pipeline de ML completo configurado |
| 1.3 | División de datos y validación cruzada | 2h | Train/test/validation split con temporalidad; estratificación para clases desbalanceadas; validación cruzada k-fold; data leakage: el error más caro en ML; ejercicio práctico: dividir correctamente un dataset de churn ecuatoriano |
| 1.4 | Métricas de evaluación y comunicación a directivos | 2h | Regresión: RMSE, MAE, R², MAPE en unidades de negocio; clasificación: accuracy, precision, recall, F1-score, AUC-ROC; cómo presentar métricas técnicas a audiencias no técnicas; matrices de confusión en lenguaje de negocio |
| 1.5 | Sesgo, varianza, overfitting y diagnóstico de modelos | 2h | Dilema sesgo-varianza con ejemplos de negocio; overfitting: por qué destruye los modelos en producción; curvas de aprendizaje para diagnóstico; validación cruzada como estimador honesto del rendimiento real |
| # | Tema | Horas | Lo que vas a aprender |
|---|---|---|---|
| 2.1 | Regresión lineal: supuestos, diagnóstico e interpretación | 2h | Regresión simple y múltiple; supuestos del modelo lineal; análisis de residuos; interpretación de coeficientes para directivos; ejercicio: predicción de precios de arriendo en Quito por sector (Cumbayá, Norte, Sur, Valle de los Chillos) |
| 2.2 | Regularización: Ridge, Lasso y ElasticNet | 2h | Ridge (L2), Lasso (L1) y ElasticNet; selección automática de variables con Lasso; ejercicio: regularización sobre exportaciones ecuatorianas (banano, camarón, flores) con múltiples variables predictoras |
| 2.3 | Feature engineering con contexto Ecuador | 2h | Variables derivadas: ratios, diferencias y porcentajes; variables de temporalidad con feriados ecuatorianos (Navidad, Carnaval, Semana Santa, feriados locales); regresión polinómica para relaciones no lineales; mejora del modelo de ventas con variables de calendario ecuatoriano |
| 2.4 | Pipeline completo con Scikit-learn | 2h | Pipeline con StandardScaler + OneHotEncoder + modelo + validación cruzada; Grid Search integrado en el Pipeline; exportación del Pipeline entrenado para reutilización y despliegue; publicación en GitHub como Repositorio 1 del portafolio |
| 2.5 | Proyecto de regresión: predicción de precios vivienda Quito | 2h | Regresión regularizada (Ridge/Lasso) para predecir arriendos en Quito; R² objetivo mayor a 0.75; análisis de errores por zona; informe de coeficientes en lenguaje de negocio; publicado en GitHub como Repositorio 1 con gráfico de coeficientes e interpretación |
| # | Tema | Horas | Lo que vas a aprender |
|---|---|---|---|
| 3.1 | Regresión logística y árboles de decisión | 2h | Regresión logística: modelo de referencia para clasificación binaria; árbol de decisión: visualización completa e interpretable para directivos; poda y profundidad máxima; ejercicio: clasificador de mora en créditos de cooperativas ecuatorianas |
| 3.2 | Random Forest: el modelo robusto de producción | 2h | Bagging y aleatoriedad de features; feature importance en lenguaje de negocio; manejo nativo de desbalance de clases; ejercicio: detector de fraude bancario con análisis de feature importance — publicado en GitHub como Repositorio 2 |
| 3.3 | SVM, KNN y Naive Bayes | 2h | SVM con kernel RBF para fronteras no lineales; KNN: sensibilidad al número de vecinos; Naive Bayes para categorías; comparativa de velocidad e interpretabilidad según el caso de negocio ecuatoriano |
| 3.4 | Matrices de confusión, ROC/AUC y umbral óptimo | 2h | Matriz de confusión completa con costos de negocio; precision-recall tradeoff; curva ROC y AUC; selección del umbral de decisión óptimo según el costo del error (fraude: ¿bloquear legítimas o dejar pasar fraude?); curva Precision-Recall para clases desbalanceadas |
| 3.5 | Proyecto de clasificación: detector de fraude bancario | 2h | Clasificador binario comparando Random Forest vs. XGBoost para fraude en datos representativos del sistema financiero ecuatoriano; análisis ROC/AUC completo; umbral de decisión óptimo justificado en costos de negocio; AUC objetivo mayor a 0.90; publicado en GitHub como Repositorio 2 |
| # | Tema | Horas | Lo que vas a aprender |
|---|---|---|---|
| 4.1 | K-Means y evaluación de clustering | 2h | K-Means: el algoritmo más usado en marketing; método del codo y silhouette score para elegir K; ejercicio: primera segmentación de clientes de empresa retail ecuatoriana |
| 4.2 | DBSCAN y clustering jerárquico | 2h | DBSCAN para clusters irregulares y detección de ruido/outliers; clustering jerárquico con dendrogramas; silhouette analysis comparativa; detección de anomalías en transacciones financieras |
| 4.3 | Reducción de dimensionalidad: PCA y t-SNE | 2h | PCA: proyección lineal, varianza explicada, visualización 2D de segmentos; t-SNE para exploración no lineal; ejercicio: visualización de segmentos de clientes ecuatorianos con PCA — publicado en GitHub como Repositorio 3 |
| 4.4 | Segmentación RFM y reglas de asociación | 2h | Análisis RFM (Recencia, Frecuencia, Monto): estándar del retail ecuatoriano; 4 segmentos accionables: VIP, en riesgo, nuevos de potencial, inactivos; reglas de asociación con Apriori para market basket analysis; propuesta de campaña por segmento con ROI estimado |
| 4.5 | Isolation Forest y detección de anomalías | 2h | Isolation Forest para anomalías multivariables; aplicación a detección de transacciones sospechosas y fraude sin etiquetas; evaluación de modelos no supervisados; presentación de los segmentos ante la clase como si fuera un equipo de marketing |
| # | Tema | Horas | Lo que vas a aprender |
|---|---|---|---|
| 5.1 | XGBoost: el más usado en producción empresarial | 2h | Gradient Boosting: corregir errores iterativamente; XGBoost: regularización, manejo de nulos, paralelización; implementación completa sobre datos de churn ecuatoriano; comparativa con Random Forest en velocidad y métricas |
| 5.2 | LightGBM y CatBoost | 2h | LightGBM: 13x más rápido que XGBoost en 119M filas (benchmark Microsoft Research); leaf-wise growth; CatBoost: variables categóricas sin encoding manual; cuándo elegir cada uno; benchmark en dataset ecuatoriano de alto volumen |
| 5.3 | Optuna: optimización automática de hiperparámetros | 2h | Grid Search y Random Search: sus límites; Optuna: búsqueda bayesiana con pruning (elimina experimentos malos temprano); espacio de búsqueda para XGBoost y LightGBM; ejercicio: optimizar el modelo de churn con Optuna hasta superar el baseline |
| 5.4 | SHAP y LIME: explicabilidad para directivos y reguladores | 2h | SHAP: teoría de juegos aplicada a ML; feature importance global con gráficos de barras; gráficos de fuerza para predicciones individuales; beeswarm plots; LIME para explicaciones locales; caso: explicar qué lleva a un cliente a hacer churn en telecomunicaciones Ecuador |
| 5.5 | Pipeline completo XGBoost + Optuna + SHAP | 2h | Pipeline de producción: preprocesamiento → XGBoost → Optuna → SHAP → informe ejecutivo; pipeline de churn con análisis SHAP completo publicado en GitHub como Repositorio 4 con gráficos listos para directivos |
| # | Tema | Horas | Lo que vas a aprender |
|---|---|---|---|
| 6.1 | Componentes de series temporales y descomposición | 2h | Tendencia, estacionalidad, ciclo y ruido; descomposición con statsmodels; estacionariedad y test ADF; ACF y PACF para identificar parámetros de ARIMA; decomposición de series de ventas de empresa ecuatoriana |
| 6.2 | ARIMA calibrado sobre datos Ecuador | 2h | ARIMA: calibración de p, d, q con datos reales; SARIMA para estacionalidad múltiple; validación walk-forward; métricas: MAE, RMSE, MAPE; análisis de errores en feriados y temporadas ecuatorianas |
| 6.3 | Prophet (Meta) con feriados Ecuador | 2h | Configuración del calendario ecuatoriano oficial en Prophet (Navidad, Año Nuevo, Carnaval, Semana Santa, feriados locales); robustez a outliers y datos faltantes; visualización automática de componentes de tendencia y estacionalidad |
| 6.4 | Comparativa ARIMA vs. Prophet y proyección de inventarios | 2h | Evaluación comparativa en el mismo dataset de ventas Ecuador; selección del modelo con mejor MAPE y justificación técnica; proyección de inventario óptimo para reducción de merma; cálculo del ahorro en merma en USD — publicado en GitHub como Repositorio 5 |
| 6.5 | Aplicaciones de series temporales en sectores Ecuador | 2h | Pronóstico de demanda energética (Ministerio de Energía); predicción de exportaciones ecuatorianas para ProEcuador; análisis de tendencias de precios del banano, cacao y camarón (datos BCE/MAGAP); preparación del dataset de series temporales del proyecto empresa |
| # | Tema | Horas | Lo que vas a aprender |
|---|---|---|---|
| 7.1 | Por qué el 80% de los modelos nunca llegan a producción | 2h | El gap entre el notebook y producción; qué es MLOps y por qué cambió la industria; serialización de modelos: pickle y joblib; diferencias entre desplegar un modelo y desplegar una API; planificación del proyecto de despliegue |
| 7.2 | MLflow: trazabilidad de experimentos y model registry | 2h | Configuración de MLflow localmente; registro automático de métricas, parámetros, hiperparámetros y el modelo; comparativa de experimentos en la UI de MLflow; model registry: versiones, staging y producción; registro del modelo de fraude del módulo 3 en MLflow |
| 7.3 | FastAPI: API REST de predicción con documentación automática | 2h | Por qué FastAPI es el estándar para despliegue de modelos ML; estructura de una API de predicción: endpoint /predict con schema de entrada/salida; carga del modelo serializado; documentación automática con Swagger UI; manejo de errores y validación de entrada con Pydantic |
| 7.4 | Docker: contenedorización del stack ML | 2h | Qué es Docker y por qué el modelo en tu computadora no funciona en el servidor; Dockerfile para el modelo + FastAPI; docker build y docker run; docker-compose para modelo + API en un solo comando; ejercicio: contenedorizar la API de fraude para que funcione en cualquier servidor con un solo comando |
| 7.5 | Monitoreo de modelos y MLOps: el ciclo completo | 2h | Data drift: cuándo los datos cambian y el modelo se deteriora; model drift: cuándo las predicciones dejan de ser válidas; métricas de monitoreo en producción; alertas automáticas; el ciclo completo de MLOps: desde el notebook hasta el modelo monitoreado en producción; API FastAPI del modelo publicada en GitHub como Repositorio 6 |
| # | Tema | Horas | Lo que vas a aprender |
|---|---|---|---|
| 8.1 | Construcción del portafolio GitHub profesional | 2h | READMEs de alto impacto con métricas, badges de tecnología y links al demo de la API; perfil GitHub optimizado con contribuciones visibles; README maestro que une los 7 repositorios del portafolio; estrategia de posicionamiento en LinkedIn como ML engineer con keywords de la industria 2026 |
| 8.2 | Acceso al dataset real de empresa y definición del problema | 2h | Dataset anonimizado de empresa del ecosistema ITSEIA (banca, retail, salud o agro según perfil del participante); análisis del problema empresarial con contexto de negocio real; definición del alcance, métricas de éxito y plan de entrega |
| 8.3 | Ciclo completo de ML sobre datos reales de empresa | 2h | Limpieza y preparación del dataset real; modelado con el stack del curso: Scikit-learn + XGBoost/LightGBM + Optuna; análisis SHAP completo; construcción de la API FastAPI del modelo y registro en MLflow |
| 8.4 | Mentoría 1:1 — sesiones con Héctor Bolívar Velasco Álvarez | 2h | Primera sesión individual de 45 minutos: revisión del portafolio GitHub completo + orientación de carrera personalizada hacia los roles de mayor crecimiento (ML engineer, científico de datos, MLOps); segunda sesión de 45 minutos: feedback del proyecto empresa + presentación ante panel evaluador + orientación sobre oportunidades en el ecosistema de datos Ecuador |
| 8.5 | Presentación final y carta de referencia profesional | 2h | Presentación del ciclo completo de ML del proyecto empresa ante panel evaluador con al menos un directivo de la empresa cliente; entregables: notebook documentado, API FastAPI con endpoint de predicción, informe ejecutivo con impacto de negocio cuantificado en USD; carta de referencia profesional de ITSEIA ACADEMY S.A.S.; acceso a la red de empresas del ecosistema para oportunidades laborales |
| # | Proyecto | Dataset / Fuente | Métrica de éxito | Entregable |
|---|---|---|---|---|
| 1 | Predicción de precios de vivienda en Quito | Portales inmobiliarios ecuatorianos por sector | R² mayor a 0.75 + análisis de coeficientes en lenguaje de negocio | Repositorio 1 con README, gráfico de coeficientes y notebook documentado |
| 2 | Detector de fraude bancario con análisis ROC | Datos representativos del sistema financiero ecuatoriano | AUC mayor a 0.90 + umbral de decisión justificado en costos | Repositorio 2: Random Forest vs. XGBoost con análisis ROC/AUC completo |
| 3 | Segmentación RFM de clientes retail Ecuador | Transacciones de empresa retail ecuatoriana (datos del curso) | 4 segmentos accionables + visualización PCA 2D + propuesta de campaña | Repositorio 3: clustering + PCA + propuesta diferenciada por segmento |
| 4 | Pipeline churn con XGBoost + Optuna + SHAP | Datos de telecomunicaciones ecuatorianas | Pipeline optimizado + análisis SHAP con 5 variables más influyentes | Repositorio 4: pipeline completo + gráficos SHAP listos para directivos |
| 5 | Pronóstico ventas: ARIMA vs. Prophet con feriados Ecuador | Ventas semanales cadena retail + calendario feriados oficiales | MAPE justificado + ahorro en merma cuantificado en USD | Repositorio 5: comparativa técnica + proyección de inventario óptimo |
| 6 | API FastAPI del modelo de fraude con MLflow + Docker | Modelo del Repositorio 2 | API funcional con Swagger UI + experimento en MLflow + Dockerfile | Repositorio 6: API ejecutable con un solo comando `docker run` |
| 7 | Portafolio unificado con README maestro | 6 repositorios anteriores + LinkedIn | Perfil GitHub profesional con 6 proyectos, demos y LinkedIn optimizado | README maestro + URL del portafolio + video de 5 minutos presentando el portafolio |
| 8 | Proyecto empresa cliente — ciclo ML completo | Dataset real bajo confidencialidad (ecosistema ITSEIA) | Modelo en producción como API + impacto de negocio cuantificado en USD | Notebook + API FastAPI + informe ejecutivo + presentación ante panel con directivo de la empresa |
| Herramienta | Versión 2026 | Para qué |
|---|---|---|
| Scikit-learn | 1.5+ | Framework ML completo, API consistente para todos los modelos |
| XGBoost | 2.x | Gradient boosting de alto rendimiento, más usado en producción |
| LightGBM | 4.x | Entrenamiento 13x más rápido en datasets grandes |
| CatBoost | 1.x | Variables categóricas sin encoding, competitivo con XGBoost |
| Optuna | 3.x | Optimización automática de hiperparámetros con pruning |
| SHAP | 0.45+ | Explicabilidad global y local de cualquier modelo |
| LIME | 0.2+ | Explicaciones locales de predicciones individuales |
| Prophet (Meta) | 1.1+ | Pronóstico temporal con feriados Ecuador incorporados |
| statsmodels | 0.14+ | ARIMA/SARIMA para series temporales clásicas |
| FastAPI | 0.110+ | APIs REST de modelos ML con Swagger automático |
| MLflow | 2.x | Trazabilidad de experimentos, model registry, reproducibilidad |
| Docker | 26+ | Contenedorización del stack ML para despliegue en cualquier servidor |
| GitHub + GitHub Actions | 2026 | Portafolio profesional público con CI/CD básico |
Formato: 60% sesiones sincrónicas en vivo con live-coding + 40% práctica asincrónica en notebooks + 2 sesiones de mentoría 1:1
Distribución de la evaluación:
| Componente | Peso |
|---|---|
| Módulos 1–6: Proyectos y evaluaciones del nivel Estándar (promedio) | 35% |
| Módulo 7: API FastAPI funcional con MLflow + contenedor Docker documentado | 15% |
| Módulo 8: Portafolio GitHub (7 repositorios, README maestro, video, LinkedIn) | 15% |
| Módulo 8: Proyecto empresa cliente (ciclo ML completo, API, presentación ejecutiva) | 25% |
| Sesiones de mentoría 1:1 y participación activa | 10% |
| **TOTAL** | **100%** |
| Rol | Salario inicial | Senior | Empresas |
|---|---|---|---|
| Científico de Datos Semi-senior | $1,500/mes | $4,500/mes | Banco Pichincha, Produbanco, Globant Ecuador |
| Ingeniero de Machine Learning | $1,800/mes | $6,000/mes | Empresas financieras, startups, multinacionales |
| ML Engineer remoto LATAM/USA | $2,500/mes | $8,500/mes | Empresas internacionales con talento remoto Ecuador |
| Científico de Datos sector financiero | $2,000/mes | $6,500/mes | Bancos privados, aseguradoras, fintech Ecuador |
| Consultor de ML freelance | $60/hora | $150/hora | PYMEs con proyectos de datos, exportadoras |
En 2026, llevar modelos ML a producción confiable es la habilidad más escasa y mejor pagada. Un portafolio GitHub con una API FastAPI funcional, experimentos en MLflow y un proyecto real de empresa es el diferenciador que convierte una entrevista en una oferta de trabajo. Banco Pichincha paga $4,500-$6,500/mes a ingenieros ML senior; Globant llega a $8,500/mes en roles de lead.
Categoría Corta 80h · Avalado por el Ministerio del Trabajo del Ecuador
Operador: ITSEIA ACADEMY S.A.S. · RUC 1793233739001
Modalidad: Virtual · Área: 06 — Informática y Comunicación
Incluye además: constancia de 2 sesiones de mentoría 1:1 con Héctor Bolívar Velasco Álvarez y carta de referencia profesional de ITSEIA ACADEMY S.A.S.
| # | Referencia |
|---|---|
| 1 | Géron, A. (2022). Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow (3.a ed.). O'Reilly Media. |
| 2 | LightGBM 13x más rápido que XGBoost (benchmark Microsoft Research 119M filas): https://www.spaceo.ai/blog/machine-learning-tech-stack/ |
| 3 | "El 80% de los modelos ML nunca llegan a producción": estado conocido del sector MLOps, documentado en múltiples fuentes académicas y de industria. |
| 4 | FastAPI como estándar de despliegue de modelos ML: https://www.f22labs.com/blogs/10-best-ai-model-deployment-tools/ |
| 5 | Aprender21 (2026). Salario ML engineer Ecuador $50,000/año, Banco Pichincha $4,500-$6,500/mes, Globant $8,500/mes: https://www.aprender21.com/blog/inteligencia-artificial-ecuador-guia-2026 |
| 6 | MLflow: el MLOps más adoptado 2025: https://www.kernshell.com/best-practices-for-scalable-machine-learning-deployment/ |
| 7 | XGBoost dominante en competencias Kaggle datos tabulares: evidencia en Kaggle leaderboards 2024-2026. |
*ITSEIA ACADEMY S.A.S. — Instituto Ecuatoriano de Inteligencia Artificial*
*itseia.ai · administracion@itseia.ai · WhatsApp 0997489821*
*Inscripciones: itseia.ai/cursos · Abril 2026*
Te respondemos en menos de 1 hora con tus credenciales.
💬 Enviar comprobante por WhatsAppFactura electrónica al correo + credenciales plataforma + bienvenida del instructor.