ITSEIA Inicio · Cursos · Machine Learning Aplicado a Ne 💬 WhatsApp
Certificado MDT · Ministerio del Trabajo

Machine Learning Aplicado a Negocios

3 niveles de profundidad. Modalidad 100% virtual con instructor en vivo. Certificado oficial del Ministerio del Trabajo del Ecuador al aprobar.

3niveles
40-80hpor nivel
$99-297según nivel
MDTcertificado

Cómo reservar tu cupo

3 pasos simples · acceso en menos de 12 horas tras confirmar el pago

1

Realiza la transferencia bancaria

BancoProdubanco
TipoCuenta Corriente
Número27059145711
TitularITSEIA ACADEMY S.A.S.
RUC1793233739001
ConceptoCurso Machine Learning Aplicado a Negocios

Acepta Pichincha, Bolivariano, Guayaquil, Banco del Pacífico y otros bancos. Transferencia interbancaria sin recargo desde Produbanco.

2

Envía tu comprobante

Mándanos foto o PDF del comprobante de transferencia por WhatsApp con tu nombre completo, número de cédula y nivel del curso (Express / Estándar / Completo).

📲 Enviar comprobante por WhatsApp
3

Recibe tu acceso en 12 horas

Te entregamos:

  • ✅ Factura electrónica por correo
  • ✅ Credenciales de plataforma tecnologico.itseia.ai
  • ✅ Bienvenida del instructor por WhatsApp
  • ✅ Calendario de inicio del curso

¿Tienes preguntas antes de pagar?

💬 Conversar con asesor por WhatsApp

Elige tu nivel

3 niveles del mismo curso · cada uno con más profundidad y proyectos. Pulsa "Ver contenido" para ver módulos, herramientas y salida laboral.

Machine Learning Aplicado a Negocios — Express (40h · $99)

Operador: ITSEIA ACADEMY S.A.S. (RUC 1793233739001)

Coordinador Pedagógico: Héctor Bolívar Velasco Álvarez

Modalidad: Virtual · Área MDT: 06 — Informática y Comunicación

Estructura: 4 módulos × 5 temas × 2 horas por tema = 40h totales


Para quién es (4 perfiles)

  • Analistas de datos que ya conocen Python básico y Pandas, y quieren construir sus primeros modelos predictivos de Machine Learning con Scikit-learn
  • Científicos de datos junior que buscan dominar el stack esencial de ML supervisado: regresión, clasificación y evaluación de modelos, con proyectos sobre datos empresariales ecuatorianos
  • Profesionales de banca, finanzas y telecomunicaciones que trabajan en proyectos de predicción de churn, scoring crediticio o detección de fraude y quieren construir los modelos ellos mismos
  • Desarrolladores de software que quieren especializarse en ML/AI para acceder a roles de mayor remuneración en el mercado ecuatoriano y LATAM

Objetivo general

Formar a los participantes en los fundamentos teóricos y prácticos del Machine Learning supervisado aplicado a contextos empresariales, capacitándolos para construir y evaluar modelos de regresión y clasificación que resuelvan problemas reales de negocio como predicción de ventas, detección de fraude y clasificación de clientes, utilizando Python y Scikit-learn. El participante cubre el ciclo completo de ML supervisado: preparación de datos, modelado, evaluación y presentación de resultados con impacto de negocio.


Módulos y temas

Módulo 1: Fundamentos de Machine Learning (10h)

#TemaHorasLo que vas a aprender
1.1Qué es el Machine Learning y cómo lo usan las empresas ecuatorianas2hDefinición de ML y diferencia con la IA tradicional; tipos de ML: supervisado, no supervisado y por refuerzo; casos reales en Ecuador: Banco Pichincha en scoring crediticio, Corporación Favorita en predicción de demanda, telecomunicaciones en predicción de churn; ecosistema ML en Python con Scikit-learn
1.2Ciclo de vida de un proyecto de ML2hLas 7 fases de un proyecto de ML: pregunta de negocio, datos, preparación, modelado, evaluación, interpretación y presentación; cómo se diferencia el trabajo de un científico de datos del de un analista; documentación de decisiones en cada fase; herramientas del ecosistema ML en Python
1.3Preparación de datos para modelado2hDivisión de datos en train/test/validation y por qué es crítico hacerlo bien; técnicas de muestreo: estratificado para clases desbalanceadas; encoding de variables categóricas: Label Encoding y One-Hot Encoding; feature scaling: por qué algunos algoritmos lo requieren; ejercicio práctico: preparar un dataset de clientes ecuatorianos para el primer modelo
1.4Métricas de evaluación de modelos2hMétricas para regresión: RMSE, MAE, R², MAPE — cuál usar según el contexto de negocio; métricas para clasificación: accuracy, precision, recall, F1-score — cuál priorizar según el costo del error; matrices de confusión: cómo leerlas y qué significan para el negocio; curvas ROC/AUC: interpretación para audiencias no técnicas
1.5Sesgo vs. varianza, overfitting y validación cruzada2hEl dilema sesgo-varianza explicado con ejemplos de negocio; qué es el overfitting y por qué destruye los modelos en producción; validación cruzada k-fold para estimar el rendimiento real; cómo saber si tu modelo generalizará bien a datos nuevos; ejercicio práctico: detectar y corregir overfitting en un modelo de clasificación

Módulo 2: Aprendizaje Supervisado — Regresión (10h)

#TemaHorasLo que vas a aprender
2.1Regresión lineal simple y múltiple2hConcepto de regresión y cuándo usarla; regresión lineal simple con una variable predictora; regresión múltiple con varias variables; interpretación de coeficientes en lenguaje de negocio; supuestos del modelo lineal y cómo verificarlos; ejercicio: primer modelo de regresión con datos de ventas ecuatorianas
2.2Regularización: Ridge, Lasso y ElasticNet2hPor qué la regresión lineal simple se sobreajusta con muchas variables; Ridge (L2): penaliza coeficientes grandes; Lasso (L1): elimina variables irrelevantes automáticamente; ElasticNet: combinación de Ridge y Lasso; cuándo usar cada uno en proyectos de negocio; ejercicio práctico: predicción de precios de arriendo en Quito con regularización
2.3Feature engineering para mejorar modelos2hCreación de nuevas variables a partir de las existentes; interacciones entre variables; variables polinómicas para capturar relaciones no lineales; variables de fecha: mes, día de la semana, temporada; ejercicio práctico: mejorar el modelo de predicción de ventas con feature engineering contextualizado en Ecuador (feriados, temporadas)
2.4Evaluación y diagnóstico de modelos de regresión2hAnálisis de residuos: distribución, homocedasticidad, autocorrelación; gráficos de diagnóstico: residuos vs. valores ajustados, QQ-plot; detección de puntos de influencia (outliers que distorsionan el modelo); cómo presentar el rendimiento de un modelo a una audiencia de negocio con RMSE en unidades reales
2.5Proyecto de regresión: predicción de ventas retail Ecuador2hConstrucción completa de un modelo de predicción de ventas mensuales para empresa retail ecuatoriana; feature engineering con estacionalidad y feriados del Ecuador (Navidad, Carnaval, Semana Santa); evaluación con RMSE objetivo menor al 15% de la venta promedio; presentación ejecutiva del modelo con impacto económico cuantificado

Módulo 3: Aprendizaje Supervisado — Clasificación (10h)

#TemaHorasLo que vas a aprender
3.1Regresión logística y árboles de decisión2hRegresión logística: el modelo de clasificación de referencia; por qué empezar siempre con el modelo más simple; árboles de decisión: interpretables y visualizables para directivos; profundidad máxima y criterios de parada; visualización del árbol con sklearn; ejercicio: clasificador de riesgo crediticio básico
3.2Random Forest y métodos de ensemble básicos2hPor qué un bosque de árboles aleatorios supera a un solo árbol; bagging: la idea detrás de Random Forest; feature importance: cómo saber qué variables importan más; manejo nativo de valores faltantes y variables categóricas; ejercicio: detector de transacciones fraudulentas con Random Forest sobre datos del sistema financiero ecuatoriano
3.3Support Vector Machines, KNN y Naive Bayes2hSVM: el hiperplano que separa clases — cuándo usarlo; K-Nearest Neighbors: el clasificador por vecindad — ventajas y limitaciones; Naive Bayes: velocidad y eficiencia para texto y categorías; cuándo elegir cada algoritmo según el tipo de problema y el volumen de datos
3.4Matrices de confusión, ROC/AUC y selección de modelo2hMatriz de confusión completa: TP, TN, FP, FN; precision vs. recall: cuándo priorizar cada uno según el costo del error en el negocio; curva ROC y AUC para comparar modelos sin depender del umbral; selección del mejor modelo según el costo del error de negocio: ¿qué es peor, un falso positivo o un falso negativo?
3.5Proyecto de clasificación: scoring crediticio en cooperativas Ecuador2hConstrucción de un clasificador de riesgo crediticio con datos representativos de cooperativas ecuatorianas de ahorro y crédito (SEPS); comparativa árbol de decisión vs. Random Forest; análisis completo de curva ROC/AUC; objetivo: F1-score mayor a 0.75; presentación ejecutiva con recomendación justificada del modelo para implementar

Módulo 4: Proyecto de ML Aplicado (10h)

#TemaHorasLo que vas a aprender
4.1Definición del problema y métricas de éxito2hCómo convertir una pregunta de negocio en un proyecto de ML; definición de la métrica de éxito del modelo en términos de negocio (no solo de estadística); identificación de datos disponibles y sus limitaciones; planificación del proyecto en 5 etapas con tiempos estimados
4.2Preparación del dataset y análisis exploratorio2hLimpieza y preparación del dataset del proyecto final; EDA específico para ML: distribuciones, correlaciones, desbalance de clases; feature engineering inicial; estrategia de validación: train/test split o validación cruzada según el tamaño del dataset
4.3Modelado baseline y comparativa de algoritmos2hConstrucción del modelo baseline (siempre empezar por el más simple); implementación de al menos 2 algoritmos adicionales; comparativa sistemática con métricas consistentes; análisis de errores: dónde falla cada modelo y por qué; selección del mejor modelo con justificación técnica
4.4Interpretación de resultados con impacto de negocio2hTraducción de las métricas del modelo a impacto de negocio cuantificado (USD, tiempo, reducción de errores); feature importance para comunicar qué variables son más relevantes; gráficos interpretables para audiencias directivas; cálculo del ROI esperado de la implementación del modelo
4.5Presentación ejecutiva del proyecto ante la clase2hEstructura de la presentación de resultados de ML para directivos: problema, datos, modelo, resultados, recomendación; presentación de 10 minutos ante la clase con retroalimentación del instructor; documentación del notebook con markdown profesional; próximos pasos para llevar el modelo a producción

Proyectos prácticos

#ProyectoDataset / FuenteMétrica de éxitoEntregable
1Predicción de ventas mensuales — empresa retail EcuadorDatos de ventas con estacionalidad y feriados ecuatorianos (Navidad, Carnaval, Semana Santa)RMSE menor al 15% de la venta promedio mensualModelo de regresión documentado + informe de coeficientes en lenguaje de negocio
2Clasificador de riesgo crediticio en cooperativasDatos representativos de cooperativas de ahorro y crédito (estructura SEPS)F1-score mayor a 0.75 con análisis ROC/AUC completoComparativa árbol de decisión vs. Random Forest con recomendación justificada
3Proyecto final a elección: churn, fraude o segmentaciónDatos propios del participante o dataset de Kaggle sobre el sector elegidoImpacto económico estimado cuantificado en USD + métricas técnicas documentadasNotebook Jupyter + presentación ejecutiva de 10 diapositivas ante la clase
4Contextualización Ecuador: análisis de caso realBanco Pichincha, Produbanco o cooperativas del sector financiero ecuatorianoPropuesta de mejora del modelo actual basada en los algoritmos del cursoInforme de 1 página con oportunidad identificada y mejora propuesta con ROI estimado

Herramientas

HerramientaVersión 2026Para qué
Scikit-learn1.5+Framework ML completo: API consistente para todos los modelos
Pandas + NumPy2.x / 2.xPreparación y manipulación de datos para ML
Matplotlib + Seaborn3.x / 0.13+Visualización de resultados y curvas ROC
Jupyter Notebook / Google Colab2026Entorno interactivo de experimentación y documentación
GitHub2026Control de versiones y portafolio de proyectos
Kaggle2026Datasets públicos y benchmarking de modelos

Metodología y evaluación

Formato: 60% sesiones sincrónicas en vivo con live-coding + 40% práctica asincrónica en notebooks con datos Ecuador

Distribución de la evaluación:

ComponentePeso
Módulo 1: Quiz conceptual de ML y ejercicios de preparación de datos15%
Módulo 2: Proyecto de regresión con métricas documentadas y presentación de negocio25%
Módulo 3: Proyecto de clasificación con análisis comparativo de modelos30%
Módulo 4: Proyecto final aplicado (propuesta, desarrollo, presentación ejecutiva)20%
Participación activa en sesiones sincrónicas y foros asincrónicos10%
**TOTAL****100%**
  • Asistencia mínima requerida: 70% (28 horas de 40)
  • Calificación mínima de aprobación: 70/100
  • Sistema de calificación: escala 0–100

Salida laboral Ecuador 2026

RolSalario inicialSeniorEmpresas
Científico de Datos Junior (ML)$1,500/mes$2,500/mesBanco Pichincha, Produbanco, cooperativas de ahorro
Analista de Modelos Predictivos$1,200/mes$2,000/mesCorporación Favorita, Claro, Movistar
Especialista en ML (freelance)$40/hora$80/horaPYMEs, exportadoras, startups tech
Analista de Riesgo con ML (banca)$1,400/mes$2,200/mesBancos privados, aseguradoras, fintech Ecuador

Sectores con mayor demanda: banca y finanzas (scoring crediticio, detección de fraude), telecomunicaciones (predicción de churn), retail (predicción de demanda), agroindustria (rendimiento de cultivos).


Certificado MDT

Categoría Corta 40h · Avalado por el Ministerio del Trabajo del Ecuador

Operador: ITSEIA ACADEMY S.A.S. · RUC 1793233739001

Modalidad: Virtual · Área: 06 — Informática y Comunicación


Fuentes y referencias verificables

#Referencia
1Géron, A. (2022). Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow (3.a ed.). O'Reilly Media.
2Scikit-learn developers (2025). Documentación oficial de Scikit-learn 1.5. https://scikit-learn.org/stable/
3SEPS (2026). Estadísticas del sector cooperativista ecuatoriano. https://www.seps.gob.ec/
4Aprender21 (2026). Salario ML engineer Ecuador $50,000/año promedio. https://www.aprender21.com/blog/inteligencia-artificial-ecuador-guia-2026
5Nucamp (2026). Top 10 empresas tech Ecuador: Banco Pichincha, Globant. https://www.nucamp.co/blog/coding-bootcamp-ecuador-ecu-top-10-tech-companies-to-work-for-in-ecuador-in-2025

*ITSEIA ACADEMY S.A.S. — Instituto Ecuatoriano de Inteligencia Artificial*

*itseia.ai · administracion@itseia.ai · WhatsApp 0997489821*

*Inscripciones: itseia.ai/cursos · Abril 2026*

Machine Learning Aplicado a Negocios — Estándar (60h · $197)

Operador: ITSEIA ACADEMY S.A.S. (RUC 1793233739001)

Coordinador Pedagógico: Héctor Bolívar Velasco Álvarez

Modalidad: Virtual · Área MDT: 06 — Informática y Comunicación

Estructura: 6 módulos × 5 temas × 2 horas por tema = 60h totales


Para quién es (4 perfiles)

  • Analistas de datos con conocimientos de Python y Pandas que quieren dominar el stack completo de Machine Learning: modelos supervisados, no supervisados, métodos ensemble y series temporales, aplicados a casos reales del mercado ecuatoriano
  • Profesionales de banca, telecomunicaciones y retail (Banco Pichincha, Produbanco, cooperativas de ahorro, Claro, Movistar, Corporación Favorita) que trabajan en proyectos de predicción de churn, detección de fraude, segmentación de clientes u optimización de inventarios y quieren construir modelos propios
  • Ingenieros y analistas de datos que quieren ampliar sus capacidades hacia modelos avanzados con XGBoost, LightGBM y pronóstico temporal con Prophet, las herramientas más demandadas en ofertas de trabajo de datos en Ecuador y LATAM en 2026
  • Científicos de datos junior que buscan completar el ciclo de ML — desde el modelado hasta la presentación de resultados con impacto de negocio medible — y construir un portafolio con proyectos sobre datos ecuatorianos reales

Objetivo general

Desarrollar competencias sólidas en Machine Learning aplicado a problemas reales de negocios ecuatorianos, construyendo y evaluando modelos predictivos de regresión, clasificación, clustering y series temporales con el stack profesional 2026: Scikit-learn 1.5, XGBoost, LightGBM, Optuna y Prophet. El participante egresa capaz de seleccionar el algoritmo más adecuado para cada tipo de problema empresarial, optimizar hiperparámetros de forma sistemática, interpretar los resultados con herramientas de explicabilidad (SHAP) y presentar el impacto de negocio de sus modelos a audiencias ejecutivas no técnicas.


Módulos y temas

Módulo 1: Fundamentos de Machine Learning para Negocios (10h)

#TemaHorasLo que vas a aprender
1.1ML en empresas ecuatorianas: casos reales y ecosistema2hPor qué empresas ecuatorianas ya usan ML: Banco Pichincha en fraude, Corporación Favorita en predicción de demanda, Claro en predicción de churn; tipos de ML: supervisado, no supervisado, por refuerzo; ciclo de vida de un proyecto de ML en una empresa desde la pregunta de negocio hasta la recomendación accionable
1.2Preparación del entorno profesional de ML2hAnaconda, Jupyter Notebook, Google Colab; instalación de Scikit-learn, XGBoost, LightGBM, SHAP y Optuna; configuración de un proyecto de ML con estructura de carpetas; primer notebook de ML configurado y listo para trabajar
1.3División de datos y validación cruzada2hTrain/test/validation split: por qué el orden importa en datos con temporalidad; estratificación para clases desbalanceadas; validación cruzada k-fold: cómo estimar el rendimiento real del modelo; fuga de datos (data leakage): el error más caro y cómo evitarlo; ejercicio práctico: dividir correctamente un dataset de churn ecuatoriano
1.4Métricas de evaluación según el problema de negocio2hMétricas de regresión: RMSE, MAE, R², MAPE en unidades de negocio; métricas de clasificación: accuracy, precision, recall, F1-score — cuál usar según el costo del error; AUC-ROC para comparar modelos independientemente del umbral; cómo presentar métricas técnicas a directivos sin que los aburran
1.5Scikit-learn: la API consistente del ecosistema ML2hPor qué Scikit-learn sigue siendo el estándar para datos tabulares en 2026; filosofía fit/transform/predict: cambiar de modelo es cambiar una línea de código; Pipelines de Scikit-learn para evitar fuga de datos; ColumnTransformer para preprocesar diferentes tipos de columnas; construcción del primer pipeline de ML completo

Módulo 2: Aprendizaje Supervisado — Regresión para Predicción Numérica (10h)

#TemaHorasLo que vas a aprender
2.1Regresión lineal: supuestos, implementación y diagnóstico2hRegresión lineal simple y múltiple; supuestos del modelo lineal: linealidad, homocedasticidad, independencia; análisis de residuos para detectar violaciones; interpretación de coeficientes en lenguaje de negocio; ejercicio: predicción de precios de arriendo de vivienda en Quito por sector (Cumbayá, Norte, Sur, Valle de los Chillos)
2.2Regularización: Ridge, Lasso y ElasticNet2hPor qué la regresión lineal falla con muchas variables; Ridge (L2): reduce todos los coeficientes sin eliminarlos; Lasso (L1): selección automática de variables relevantes; ElasticNet: combinación óptima; ejercicio práctico: regularización sobre dataset de exportaciones ecuatorianas (banano, camarón, flores) con múltiples variables
2.3Feature engineering para regresión2hCreación de variables derivadas: ratios, diferencias y porcentajes; variables de temporalidad: mes, trimestre, año, feriados Ecuador (Navidad, Carnaval, Semana Santa, feriados locales); regresión polinómica para relaciones no lineales; ejercicio: mejorar el modelo de predicción de ventas con variables de calendario ecuatoriano
2.4Implementación completa con Scikit-learn Pipeline2hPipeline con preprocesamiento + modelo: StandardScaler, OneHotEncoder, GridSearchCV integrados; por qué el Pipeline evita la fuga de datos de validación; validación cruzada dentro del Pipeline; exportación del Pipeline entrenado para reutilización; ejercicio: Pipeline completo para predicción de demanda de exportaciones
2.5Proyecto de regresión: predicción de ventas con impacto de negocio2hPronóstico de ventas mensuales de empresa retail ecuatoriana: construcción completa del modelo, análisis de errores por período y región, presentación de resultados con RMSE en unidades de negocio (soles/cajas/unidades); cálculo del ahorro en inventario por reducción del error de pronóstico; presentación ante la clase

Módulo 3: Aprendizaje Supervisado — Clasificación para Decisiones de Negocio (10h)

#TemaHorasLo que vas a aprender
3.1Regresión logística y árboles de decisión2hRegresión logística: el modelo de referencia para clasificación binaria; cuándo la regresión logística es suficiente y cuándo no; árboles de decisión: visualización completa del proceso de decisión para directivos; profundidad máxima, criterio de split y poda; ejercicio: clasificador de mora en créditos de cooperativas ecuatorianas
3.2Random Forest: el modelo robusto de producción2hPor qué Random Forest supera a los árboles individuales; bagging y aleatoriedad de features; importancia de variables (feature importance): comunicar qué factores importan más al negocio; manejo nativo de desbalance de clases; ejercicio: detector de transacciones fraudulentas en el sistema financiero ecuatoriano con análisis de feature importance
3.3SVM, KNN y Naive Bayes2hSupport Vector Machines: el hiperplano de margen máximo — cuándo usar con kernel RBF; K-Nearest Neighbors: clasificación por vecindad — sensibilidad al número de vecinos K; Naive Bayes: eficiencia para clasificación de texto y datos categóricos; comparativa de velocidad de entrenamiento e inferencia en datasets de tamaño empresarial ecuatoriano
3.4Matrices de confusión y umbral de decisión óptimo2hMatriz de confusión completa con interpretación de negocio; precision vs. recall: el tradeoff clave — ¿qué es más caro para el negocio, un falso positivo o un falso negativo?; curva Precision-Recall para clases desbalanceadas; curva ROC/AUC para comparar modelos; selección del umbral de decisión óptimo según el costo del error de negocio (fraude bancario: ¿bloquear transacciones legítimas o dejar pasar fraude?)
3.5Proyecto de clasificación: predicción de churn en telecomunicaciones2hPredicción de abandono de clientes (churn) en empresa de telecomunicaciones ecuatoriana; comparativa completa: Regresión Logística vs. Árbol de Decisión vs. Random Forest; análisis ROC/AUC comparativo; selección del umbral de decisión óptimo; propuesta de estrategia de retención por segmento con costo estimado y ROI proyectado

Módulo 4: Aprendizaje No Supervisado — Segmentación y Patrones (10h)

#TemaHorasLo que vas a aprender
4.1K-Means y método del codo para clustering2hConcepto de clustering: agrupar sin etiquetas; K-Means: el algoritmo más usado en marketing; método del codo (elbow method) para elegir el número óptimo de clusters K; silhouette score para evaluar la calidad del clustering; ejercicio: segmentación inicial de clientes de empresa retail ecuatoriana
4.2DBSCAN, clustering jerárquico y evaluación2hDBSCAN: clusters de forma irregular y detección automática de ruido/outliers; clustering jerárquico con dendrogramas: cuándo usarlo; comparativa K-Means vs. DBSCAN vs. jerárquico; silhouette analysis para evaluar y comparar métodos; ejercicio: detección de anomalías en datos de transacciones financieras
4.3Reducción de dimensionalidad con PCA y t-SNE2hPor qué reducir dimensiones: el problema de la maldición de la dimensionalidad; PCA (Análisis de Componentes Principales): proyección lineal, varianza explicada, visualización 2D de datos multidimensionales; t-SNE para visualización no lineal de clusters; ejercicio: visualización de segmentos de clientes en 2D con PCA
4.4Segmentación RFM: el estándar del retail ecuatoriano2hAnálisis RFM (Recencia, Frecuencia, Monto): el modelo estándar para segmentación de clientes; construcción de la segmentación RFM con K-Means; identificación de al menos 4 segmentos accionables: VIP, en riesgo, nuevos de potencial e inactivos; propuesta de campaña de marketing diferenciada por segmento con presupuesto y ROI estimado
4.5Detección de anomalías e interpretación de segmentos2hIsolation Forest para detección de anomalías multivariable; reglas de asociación con Apriori: "quienes compran X también compran Y" — market basket analysis para retail ecuatoriano; interpretación de segmentos en términos de negocio; presentación de la segmentación ante directivos: cómo hacer accionable el clustering

Módulo 5: Métodos Ensemble y Optimización — el Salto a Alto Rendimiento (10h)

#TemaHorasLo que vas a aprender
5.1Gradient Boosting: XGBoost en producción empresarial2hPor qué los métodos ensemble ganan en datos tabulares; Bagging vs. Boosting: la diferencia fundamental; Gradient Boosting: la idea de corregir errores iterativamente; XGBoost: el modelo más usado en producción empresarial; implementación completa con XGBoost sobre datos de churn ecuatoriano
5.2LightGBM y CatBoost: velocidad y variables categóricas2hLightGBM: entrenamiento 13x más rápido que XGBoost en datasets con millones de filas (benchmark Microsoft Research con 119M de filas); CatBoost: manejo nativo de variables categóricas sin encoding manual; cuándo usar XGBoost, LightGBM o CatBoost según el proyecto; comparativa de velocidad y métricas en dataset ecuatoriano de alto volumen
5.3Optuna: optimización automática de hiperparámetros2hPor qué la búsqueda manual de hiperparámetros no escala; Grid Search y Random Search: sus limitaciones; Optuna: búsqueda bayesiana con pruning inteligente (elimina experimentos malos temprano); configuración del espacio de búsqueda para XGBoost y LightGBM; ejercicio práctico: optimizar el modelo de churn con Optuna hasta superar el baseline
5.4SHAP: explicabilidad de modelos para directivos2hPor qué la explicabilidad es crítica para reguladores y directivos en 2026; SHAP (SHapley Additive exPlanations): teoría de juegos aplicada a ML; gráficos de barras de feature importance global con SHAP; gráficos de fuerza para explicar predicciones individuales; beeswarm plots para el impacto de cada variable; caso práctico: explicar qué lleva a un cliente a hacer churn en telecomunicaciones Ecuador
5.5Pipeline completo XGBoost + Optuna + SHAP con datos Ecuador2hConstrucción del pipeline completo: preprocesamiento → XGBoost → Optuna → SHAP → informe ejecutivo; predicción de churn en empresa de telecomunicaciones ecuatoriana; análisis SHAP completo con gráficos listos para presentar a directivos; recomendación de estrategia de retención basada en los factores más influyentes identificados por SHAP

Módulo 6: ML para Series Temporales + Proyecto Integrador Ecuador (10h)

#TemaHorasLo que vas a aprender
6.1Componentes de series temporales y modelos estadísticos2hComponentes: tendencia, estacionalidad, ciclo y ruido; descomposición con statsmodels; estacionariedad y test ADF; modelos ARIMA: identificación de parámetros p, d, q con ACF y PACF; SARIMA para estacionalidad múltiple; ejercicio: decomposición de series de ventas de empresa ecuatoriana
6.2ARIMA calibrado sobre datos reales de Ecuador2hCalibración de ARIMA sobre ventas semanales de cadena de distribución ecuatoriana; validación con walk-forward (simulación de producción real); métricas temporales: MAE, RMSE, MAPE; identificación de las semanas con mayor error (feriados, temporadas); interpretación de los resultados para el equipo de inventarios
6.3Prophet (Meta): pronóstico robusto con feriados Ecuador2hPor qué Prophet fue diseñado para el mundo real: robusto a outliers, días faltantes y cambios de tendencia; configuración del componente de feriados con calendario ecuatoriano oficial (Navidad, Año Nuevo, Carnaval, Semana Santa, Día del Trabajo, independencias, feriados locales); visualización automática de componentes; Prophet vs. ARIMA: cuándo usar cada uno
6.4Comparativa ARIMA vs. Prophet y proyección de inventarios2hEvaluación comparativa de ARIMA vs. Prophet sobre el mismo dataset de ventas ecuatoriano; selección del modelo con mejor MAPE y justificación; proyección de inventario óptimo para reducción de merma: cuánto producto pedir cada semana según el pronóstico; cálculo del ahorro en merma en USD para la empresa
6.5Proyecto integrador end-to-end: ciclo completo de ML en un negocio Ecuador2hEl participante aplica el ciclo completo de ML a un problema de negocio real de su sector (banca, retail, salud, agro o telecomunicaciones); desde la preparación de datos hasta el pitch ejecutivo de resultados; pitch de 10 minutos ante la clase con: problema, modelo elegido, métricas técnicas, impacto de negocio cuantificado en USD y recomendación accionable

Proyectos prácticos

#ProyectoDataset / FuenteMétrica de éxitoEntregable
1Predicción de precios de vivienda en QuitoPortales inmobiliarios ecuatorianos: sector, m2, habitaciones, parqueaderosR² mayor a 0.75 con análisis de errores por zonaModelo interpretable + informe de coeficientes en lenguaje de negocio
2Detector de transacciones fraudulentasDatos representativos del sistema financiero ecuatoriano (estructura bancaria)AUC mayor a 0.90 + recomendación de umbral justificada en costo de negocioClasificador Random Forest vs. XGBoost con análisis ROC/AUC completo
3Segmentación RFM de clientes retail ecuatorianoDatos de transacciones de empresa retail Ecuador (datos del curso)Al menos 4 segmentos accionables con propuesta de campaña y ROI proyectadoMapa de segmentos con PCA 2D + recomendaciones de acción por segmento
4Predicción de churn con XGBoost + Optuna + SHAPDatos de telecomunicaciones ecuatorianas (estructura de empresa local)Pipeline optimizado con Optuna + análisis SHAP con 5 variables más influyentesNotebook documentado + análisis SHAP listo para directivos + estrategia de retención
5Pronóstico de ventas: ARIMA vs. Prophet con feriados EcuadorVentas semanales de cadena de distribución ecuatoriana + calendario feriados oficialesModelo seleccionado con MAPE justificado + ahorro en merma cuantificado en USDComparativa técnica + proyección de inventario óptimo + pitch ejecutivo de impacto

Herramientas

HerramientaVersión 2026Para qué
Scikit-learn1.5+Framework ML completo, API consistente para todos los modelos
XGBoost2.xGradient boosting de alto rendimiento, más usado en producción
LightGBM4.xEntrenamiento 13x más rápido en datasets grandes
CatBoost1.xVariables categóricas sin encoding, competitivo con XGBoost
Optuna3.xOptimización automática de hiperparámetros con pruning inteligente
SHAP0.45+Explicabilidad global y local de cualquier modelo
LIME0.2+Explicaciones locales de predicciones individuales
Prophet (Meta)1.1+Pronóstico temporal con feriados Ecuador incorporados
statsmodels (ARIMA/SARIMA)0.14+Modelos estadísticos clásicos para series temporales
Pandas + Polars2.x / 1.xPreparación y manipulación de datos para ML
Matplotlib + Seaborn3.x / 0.13+Visualización de resultados de modelos
GitHub + Kaggle2026Portafolio y benchmarking con la comunidad global de ML

Metodología y evaluación

Formato: 60% sesiones sincrónicas en vivo con live-coding + 40% práctica asincrónica con notebooks de proyectos sobre datos Ecuador

Distribución de la evaluación:

ComponentePeso
Módulo 1: Quiz de fundamentos ML + configuración del entorno5%
Módulo 2: Modelo de regresión sobre datos Ecuador (R² objetivo >0.75)15%
Módulo 3: Clasificador con análisis ROC/AUC comparativo y umbral de decisión15%
Módulo 4: Segmentación RFM con clustering + propuesta de marketing accionable15%
Módulo 5: Pipeline XGBoost + Optuna con análisis SHAP interpretable15%
Módulo 6: Pronóstico series temporales + proyecto integrador end-to-end25%
Participación activa en sesiones sincrónicas y foros asincrónicos10%
**TOTAL****100%**
  • Asistencia mínima: 70% (42 de 60 horas)
  • Calificación mínima de aprobación: 70/100
  • Sistema: escala 0-100

Salida laboral Ecuador 2026

RolSalario inicialSeniorEmpresas
Científico de Datos Junior-Medio$1,000/mes$3,500/mesBanco Pichincha, Produbanco, Globant Ecuador
Ingeniero de Machine Learning$1,200/mes$4,500/mesEmpresas tecnología, sector financiero
Analista de Riesgo con ML$1,100/mes$3,500/mesBancos, aseguradoras, cooperativas de ahorro
Especialista en Predicción de Demanda$900/mes$2,800/mesCorporación Favorita, distribuidoras, exportadoras
ML Engineer remoto para LATAM$2,000/mes$6,000/mesEmpresas extranjeras con talento Ecuador

Los ingenieros de ML en Ecuador ganan en promedio alrededor de $50,000 USD anuales ($4,000/mes), con Banco Pichincha pagando $4,500-$6,500/mes a nivel senior y Globant hasta $8,500/mes en roles de lead (aprender21.com 2026, nucamp.co 2026). El dominio de XGBoost, SHAP y Prophet es el diferenciador más consistente en el mercado.


Certificado MDT

Categoría Corta 60h · Avalado por el Ministerio del Trabajo del Ecuador

Operador: ITSEIA ACADEMY S.A.S. · RUC 1793233739001

Modalidad: Virtual · Área: 06 — Informática y Comunicación


Fuentes y referencias verificables

#Referencia
1Géron, A. (2022). Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow (3.a ed.). O'Reilly Media.
2LightGBM 13x más rápido que XGBoost en 119M filas (benchmark Microsoft Research): https://www.spaceo.ai/blog/machine-learning-tech-stack/
3Aprender21 (2026). Salario ML engineer Ecuador $50,000/año promedio: https://www.aprender21.com/blog/inteligencia-artificial-ecuador-guia-2026
4Nucamp (2026). Top 10 tech companies Ecuador: Banco Pichincha $4,500-$6,500/mes, Globant $8,500/mes lead: https://www.nucamp.co/blog/coding-bootcamp-ecuador-ecu-top-10-tech-companies-to-work-for-in-ecuador-in-2025
5SEPS (2026). Estadísticas del cooperativismo ecuatoriano: https://www.seps.gob.ec/
6Scikit-learn 2026 sigue siendo referencia para fraud detection, churn y scoring: https://scale.jobs/blog/top-ml-frameworks-job-seekers

*ITSEIA ACADEMY S.A.S. — Instituto Ecuatoriano de Inteligencia Artificial*

*itseia.ai · administracion@itseia.ai · WhatsApp 0997489821*

*Inscripciones: itseia.ai/cursos · Abril 2026*

Machine Learning Aplicado a Negocios — Completo (80h · $297)

Operador: ITSEIA ACADEMY S.A.S. (RUC 1793233739001)

Coordinador Pedagógico: Héctor Bolívar Velasco Álvarez

Modalidad: Virtual · Área MDT: 06 — Informática y Comunicación

Estructura: 8 módulos × 5 temas × 2 horas por tema = 80h totales


Para quién es (4 perfiles)

  • Científicos de datos que completaron el nivel Estándar y quieren dominar el ciclo completo de ML: desde la preparación de datos hasta el despliegue de un modelo en producción como API REST con FastAPI, con trazabilidad de experimentos con MLflow
  • Ingenieros de software y desarrolladores Python que quieren especializarse en ML e integrarlo en aplicaciones reales: construir APIs de predicción que otros sistemas consuman, con fundamentos de MLOps y Docker
  • Profesionales de banca, telecomunicaciones y retail con proyectos de alto impacto (detección de fraude, churn, predicción de demanda) que necesitan no solo el modelo, sino llevarlo a producción de forma reproducible y documentada
  • Científicos de datos junior que buscan el nivel máximo de formación disponible, con un proyecto real de empresa cliente como cierre del portafolio y mentoría personalizada con Héctor Bolívar Velasco Álvarez

Objetivo general

Completar la formación integral en Machine Learning incorporando el despliegue de modelos en producción mediante APIs REST con FastAPI, la trazabilidad de experimentos con MLflow, introducción a Docker y los conceptos fundamentales de MLOps, la construcción de un portafolio GitHub profesional con proyectos documentados y APIs demostrables, y la resolución de un caso de negocio real de una empresa del ecosistema ITSEIA con mentoría 1:1. El participante egresa con el ciclo completo de ML dominado: desde la pregunta de negocio hasta una API de predicción funcional en producción, con un portafolio público verificable y experiencia en un proyecto empresarial real ecuatoriano.


Módulos y temas

Módulo 1: Fundamentos de Machine Learning para Negocios (10h)

#TemaHorasLo que vas a aprender
1.1ML en empresas ecuatorianas y ecosistema profesional2hCasos reales: Banco Pichincha en fraude, Corporación Favorita en demanda, Claro en churn; tipos de ML; ciclo de vida de un proyecto en una empresa ecuatoriana; entorno: Anaconda, Jupyter, Google Colab, librerías del stack completo
1.2Scikit-learn: la API consistente del ecosistema ML2hFilosofía fit/transform/predict; cambiar de modelo con una línea de código; Pipelines para evitar fuga de datos; ColumnTransformer para columnas heterogéneas; primer pipeline de ML completo configurado
1.3División de datos y validación cruzada2hTrain/test/validation split con temporalidad; estratificación para clases desbalanceadas; validación cruzada k-fold; data leakage: el error más caro en ML; ejercicio práctico: dividir correctamente un dataset de churn ecuatoriano
1.4Métricas de evaluación y comunicación a directivos2hRegresión: RMSE, MAE, R², MAPE en unidades de negocio; clasificación: accuracy, precision, recall, F1-score, AUC-ROC; cómo presentar métricas técnicas a audiencias no técnicas; matrices de confusión en lenguaje de negocio
1.5Sesgo, varianza, overfitting y diagnóstico de modelos2hDilema sesgo-varianza con ejemplos de negocio; overfitting: por qué destruye los modelos en producción; curvas de aprendizaje para diagnóstico; validación cruzada como estimador honesto del rendimiento real

Módulo 2: Aprendizaje Supervisado — Regresión (10h)

#TemaHorasLo que vas a aprender
2.1Regresión lineal: supuestos, diagnóstico e interpretación2hRegresión simple y múltiple; supuestos del modelo lineal; análisis de residuos; interpretación de coeficientes para directivos; ejercicio: predicción de precios de arriendo en Quito por sector (Cumbayá, Norte, Sur, Valle de los Chillos)
2.2Regularización: Ridge, Lasso y ElasticNet2hRidge (L2), Lasso (L1) y ElasticNet; selección automática de variables con Lasso; ejercicio: regularización sobre exportaciones ecuatorianas (banano, camarón, flores) con múltiples variables predictoras
2.3Feature engineering con contexto Ecuador2hVariables derivadas: ratios, diferencias y porcentajes; variables de temporalidad con feriados ecuatorianos (Navidad, Carnaval, Semana Santa, feriados locales); regresión polinómica para relaciones no lineales; mejora del modelo de ventas con variables de calendario ecuatoriano
2.4Pipeline completo con Scikit-learn2hPipeline con StandardScaler + OneHotEncoder + modelo + validación cruzada; Grid Search integrado en el Pipeline; exportación del Pipeline entrenado para reutilización y despliegue; publicación en GitHub como Repositorio 1 del portafolio
2.5Proyecto de regresión: predicción de precios vivienda Quito2hRegresión regularizada (Ridge/Lasso) para predecir arriendos en Quito; R² objetivo mayor a 0.75; análisis de errores por zona; informe de coeficientes en lenguaje de negocio; publicado en GitHub como Repositorio 1 con gráfico de coeficientes e interpretación

Módulo 3: Aprendizaje Supervisado — Clasificación (10h)

#TemaHorasLo que vas a aprender
3.1Regresión logística y árboles de decisión2hRegresión logística: modelo de referencia para clasificación binaria; árbol de decisión: visualización completa e interpretable para directivos; poda y profundidad máxima; ejercicio: clasificador de mora en créditos de cooperativas ecuatorianas
3.2Random Forest: el modelo robusto de producción2hBagging y aleatoriedad de features; feature importance en lenguaje de negocio; manejo nativo de desbalance de clases; ejercicio: detector de fraude bancario con análisis de feature importance — publicado en GitHub como Repositorio 2
3.3SVM, KNN y Naive Bayes2hSVM con kernel RBF para fronteras no lineales; KNN: sensibilidad al número de vecinos; Naive Bayes para categorías; comparativa de velocidad e interpretabilidad según el caso de negocio ecuatoriano
3.4Matrices de confusión, ROC/AUC y umbral óptimo2hMatriz de confusión completa con costos de negocio; precision-recall tradeoff; curva ROC y AUC; selección del umbral de decisión óptimo según el costo del error (fraude: ¿bloquear legítimas o dejar pasar fraude?); curva Precision-Recall para clases desbalanceadas
3.5Proyecto de clasificación: detector de fraude bancario2hClasificador binario comparando Random Forest vs. XGBoost para fraude en datos representativos del sistema financiero ecuatoriano; análisis ROC/AUC completo; umbral de decisión óptimo justificado en costos de negocio; AUC objetivo mayor a 0.90; publicado en GitHub como Repositorio 2

Módulo 4: Aprendizaje No Supervisado (10h)

#TemaHorasLo que vas a aprender
4.1K-Means y evaluación de clustering2hK-Means: el algoritmo más usado en marketing; método del codo y silhouette score para elegir K; ejercicio: primera segmentación de clientes de empresa retail ecuatoriana
4.2DBSCAN y clustering jerárquico2hDBSCAN para clusters irregulares y detección de ruido/outliers; clustering jerárquico con dendrogramas; silhouette analysis comparativa; detección de anomalías en transacciones financieras
4.3Reducción de dimensionalidad: PCA y t-SNE2hPCA: proyección lineal, varianza explicada, visualización 2D de segmentos; t-SNE para exploración no lineal; ejercicio: visualización de segmentos de clientes ecuatorianos con PCA — publicado en GitHub como Repositorio 3
4.4Segmentación RFM y reglas de asociación2hAnálisis RFM (Recencia, Frecuencia, Monto): estándar del retail ecuatoriano; 4 segmentos accionables: VIP, en riesgo, nuevos de potencial, inactivos; reglas de asociación con Apriori para market basket analysis; propuesta de campaña por segmento con ROI estimado
4.5Isolation Forest y detección de anomalías2hIsolation Forest para anomalías multivariables; aplicación a detección de transacciones sospechosas y fraude sin etiquetas; evaluación de modelos no supervisados; presentación de los segmentos ante la clase como si fuera un equipo de marketing

Módulo 5: Métodos Ensemble y Optimización (10h)

#TemaHorasLo que vas a aprender
5.1XGBoost: el más usado en producción empresarial2hGradient Boosting: corregir errores iterativamente; XGBoost: regularización, manejo de nulos, paralelización; implementación completa sobre datos de churn ecuatoriano; comparativa con Random Forest en velocidad y métricas
5.2LightGBM y CatBoost2hLightGBM: 13x más rápido que XGBoost en 119M filas (benchmark Microsoft Research); leaf-wise growth; CatBoost: variables categóricas sin encoding manual; cuándo elegir cada uno; benchmark en dataset ecuatoriano de alto volumen
5.3Optuna: optimización automática de hiperparámetros2hGrid Search y Random Search: sus límites; Optuna: búsqueda bayesiana con pruning (elimina experimentos malos temprano); espacio de búsqueda para XGBoost y LightGBM; ejercicio: optimizar el modelo de churn con Optuna hasta superar el baseline
5.4SHAP y LIME: explicabilidad para directivos y reguladores2hSHAP: teoría de juegos aplicada a ML; feature importance global con gráficos de barras; gráficos de fuerza para predicciones individuales; beeswarm plots; LIME para explicaciones locales; caso: explicar qué lleva a un cliente a hacer churn en telecomunicaciones Ecuador
5.5Pipeline completo XGBoost + Optuna + SHAP2hPipeline de producción: preprocesamiento → XGBoost → Optuna → SHAP → informe ejecutivo; pipeline de churn con análisis SHAP completo publicado en GitHub como Repositorio 4 con gráficos listos para directivos

Módulo 6: ML para Series Temporales (10h)

#TemaHorasLo que vas a aprender
6.1Componentes de series temporales y descomposición2hTendencia, estacionalidad, ciclo y ruido; descomposición con statsmodels; estacionariedad y test ADF; ACF y PACF para identificar parámetros de ARIMA; decomposición de series de ventas de empresa ecuatoriana
6.2ARIMA calibrado sobre datos Ecuador2hARIMA: calibración de p, d, q con datos reales; SARIMA para estacionalidad múltiple; validación walk-forward; métricas: MAE, RMSE, MAPE; análisis de errores en feriados y temporadas ecuatorianas
6.3Prophet (Meta) con feriados Ecuador2hConfiguración del calendario ecuatoriano oficial en Prophet (Navidad, Año Nuevo, Carnaval, Semana Santa, feriados locales); robustez a outliers y datos faltantes; visualización automática de componentes de tendencia y estacionalidad
6.4Comparativa ARIMA vs. Prophet y proyección de inventarios2hEvaluación comparativa en el mismo dataset de ventas Ecuador; selección del modelo con mejor MAPE y justificación técnica; proyección de inventario óptimo para reducción de merma; cálculo del ahorro en merma en USD — publicado en GitHub como Repositorio 5
6.5Aplicaciones de series temporales en sectores Ecuador2hPronóstico de demanda energética (Ministerio de Energía); predicción de exportaciones ecuatorianas para ProEcuador; análisis de tendencias de precios del banano, cacao y camarón (datos BCE/MAGAP); preparación del dataset de series temporales del proyecto empresa

Módulo 7: Despliegue y Productivización de Modelos — MLOps básico (10h)

#TemaHorasLo que vas a aprender
7.1Por qué el 80% de los modelos nunca llegan a producción2hEl gap entre el notebook y producción; qué es MLOps y por qué cambió la industria; serialización de modelos: pickle y joblib; diferencias entre desplegar un modelo y desplegar una API; planificación del proyecto de despliegue
7.2MLflow: trazabilidad de experimentos y model registry2hConfiguración de MLflow localmente; registro automático de métricas, parámetros, hiperparámetros y el modelo; comparativa de experimentos en la UI de MLflow; model registry: versiones, staging y producción; registro del modelo de fraude del módulo 3 en MLflow
7.3FastAPI: API REST de predicción con documentación automática2hPor qué FastAPI es el estándar para despliegue de modelos ML; estructura de una API de predicción: endpoint /predict con schema de entrada/salida; carga del modelo serializado; documentación automática con Swagger UI; manejo de errores y validación de entrada con Pydantic
7.4Docker: contenedorización del stack ML2hQué es Docker y por qué el modelo en tu computadora no funciona en el servidor; Dockerfile para el modelo + FastAPI; docker build y docker run; docker-compose para modelo + API en un solo comando; ejercicio: contenedorizar la API de fraude para que funcione en cualquier servidor con un solo comando
7.5Monitoreo de modelos y MLOps: el ciclo completo2hData drift: cuándo los datos cambian y el modelo se deteriora; model drift: cuándo las predicciones dejan de ser válidas; métricas de monitoreo en producción; alertas automáticas; el ciclo completo de MLOps: desde el notebook hasta el modelo monitoreado en producción; API FastAPI del modelo publicada en GitHub como Repositorio 6

Módulo 8: Portafolio GitHub + Caso Real de Empresa + Mentoría 1:1 (10h)

#TemaHorasLo que vas a aprender
8.1Construcción del portafolio GitHub profesional2hREADMEs de alto impacto con métricas, badges de tecnología y links al demo de la API; perfil GitHub optimizado con contribuciones visibles; README maestro que une los 7 repositorios del portafolio; estrategia de posicionamiento en LinkedIn como ML engineer con keywords de la industria 2026
8.2Acceso al dataset real de empresa y definición del problema2hDataset anonimizado de empresa del ecosistema ITSEIA (banca, retail, salud o agro según perfil del participante); análisis del problema empresarial con contexto de negocio real; definición del alcance, métricas de éxito y plan de entrega
8.3Ciclo completo de ML sobre datos reales de empresa2hLimpieza y preparación del dataset real; modelado con el stack del curso: Scikit-learn + XGBoost/LightGBM + Optuna; análisis SHAP completo; construcción de la API FastAPI del modelo y registro en MLflow
8.4Mentoría 1:1 — sesiones con Héctor Bolívar Velasco Álvarez2hPrimera sesión individual de 45 minutos: revisión del portafolio GitHub completo + orientación de carrera personalizada hacia los roles de mayor crecimiento (ML engineer, científico de datos, MLOps); segunda sesión de 45 minutos: feedback del proyecto empresa + presentación ante panel evaluador + orientación sobre oportunidades en el ecosistema de datos Ecuador
8.5Presentación final y carta de referencia profesional2hPresentación del ciclo completo de ML del proyecto empresa ante panel evaluador con al menos un directivo de la empresa cliente; entregables: notebook documentado, API FastAPI con endpoint de predicción, informe ejecutivo con impacto de negocio cuantificado en USD; carta de referencia profesional de ITSEIA ACADEMY S.A.S.; acceso a la red de empresas del ecosistema para oportunidades laborales

Proyectos prácticos

#ProyectoDataset / FuenteMétrica de éxitoEntregable
1Predicción de precios de vivienda en QuitoPortales inmobiliarios ecuatorianos por sectorR² mayor a 0.75 + análisis de coeficientes en lenguaje de negocioRepositorio 1 con README, gráfico de coeficientes y notebook documentado
2Detector de fraude bancario con análisis ROCDatos representativos del sistema financiero ecuatorianoAUC mayor a 0.90 + umbral de decisión justificado en costosRepositorio 2: Random Forest vs. XGBoost con análisis ROC/AUC completo
3Segmentación RFM de clientes retail EcuadorTransacciones de empresa retail ecuatoriana (datos del curso)4 segmentos accionables + visualización PCA 2D + propuesta de campañaRepositorio 3: clustering + PCA + propuesta diferenciada por segmento
4Pipeline churn con XGBoost + Optuna + SHAPDatos de telecomunicaciones ecuatorianasPipeline optimizado + análisis SHAP con 5 variables más influyentesRepositorio 4: pipeline completo + gráficos SHAP listos para directivos
5Pronóstico ventas: ARIMA vs. Prophet con feriados EcuadorVentas semanales cadena retail + calendario feriados oficialesMAPE justificado + ahorro en merma cuantificado en USDRepositorio 5: comparativa técnica + proyección de inventario óptimo
6API FastAPI del modelo de fraude con MLflow + DockerModelo del Repositorio 2API funcional con Swagger UI + experimento en MLflow + DockerfileRepositorio 6: API ejecutable con un solo comando `docker run`
7Portafolio unificado con README maestro6 repositorios anteriores + LinkedInPerfil GitHub profesional con 6 proyectos, demos y LinkedIn optimizadoREADME maestro + URL del portafolio + video de 5 minutos presentando el portafolio
8Proyecto empresa cliente — ciclo ML completoDataset real bajo confidencialidad (ecosistema ITSEIA)Modelo en producción como API + impacto de negocio cuantificado en USDNotebook + API FastAPI + informe ejecutivo + presentación ante panel con directivo de la empresa

Herramientas

HerramientaVersión 2026Para qué
Scikit-learn1.5+Framework ML completo, API consistente para todos los modelos
XGBoost2.xGradient boosting de alto rendimiento, más usado en producción
LightGBM4.xEntrenamiento 13x más rápido en datasets grandes
CatBoost1.xVariables categóricas sin encoding, competitivo con XGBoost
Optuna3.xOptimización automática de hiperparámetros con pruning
SHAP0.45+Explicabilidad global y local de cualquier modelo
LIME0.2+Explicaciones locales de predicciones individuales
Prophet (Meta)1.1+Pronóstico temporal con feriados Ecuador incorporados
statsmodels0.14+ARIMA/SARIMA para series temporales clásicas
FastAPI0.110+APIs REST de modelos ML con Swagger automático
MLflow2.xTrazabilidad de experimentos, model registry, reproducibilidad
Docker26+Contenedorización del stack ML para despliegue en cualquier servidor
GitHub + GitHub Actions2026Portafolio profesional público con CI/CD básico

Metodología y evaluación

Formato: 60% sesiones sincrónicas en vivo con live-coding + 40% práctica asincrónica en notebooks + 2 sesiones de mentoría 1:1

Distribución de la evaluación:

ComponentePeso
Módulos 1–6: Proyectos y evaluaciones del nivel Estándar (promedio)35%
Módulo 7: API FastAPI funcional con MLflow + contenedor Docker documentado15%
Módulo 8: Portafolio GitHub (7 repositorios, README maestro, video, LinkedIn)15%
Módulo 8: Proyecto empresa cliente (ciclo ML completo, API, presentación ejecutiva)25%
Sesiones de mentoría 1:1 y participación activa10%
**TOTAL****100%**
  • Asistencia mínima: 70% (56 de 80 horas)
  • Calificación mínima de aprobación: 70/100
  • Sistema: escala 0-100

Salida laboral Ecuador 2026

RolSalario inicialSeniorEmpresas
Científico de Datos Semi-senior$1,500/mes$4,500/mesBanco Pichincha, Produbanco, Globant Ecuador
Ingeniero de Machine Learning$1,800/mes$6,000/mesEmpresas financieras, startups, multinacionales
ML Engineer remoto LATAM/USA$2,500/mes$8,500/mesEmpresas internacionales con talento remoto Ecuador
Científico de Datos sector financiero$2,000/mes$6,500/mesBancos privados, aseguradoras, fintech Ecuador
Consultor de ML freelance$60/hora$150/horaPYMEs con proyectos de datos, exportadoras

En 2026, llevar modelos ML a producción confiable es la habilidad más escasa y mejor pagada. Un portafolio GitHub con una API FastAPI funcional, experimentos en MLflow y un proyecto real de empresa es el diferenciador que convierte una entrevista en una oferta de trabajo. Banco Pichincha paga $4,500-$6,500/mes a ingenieros ML senior; Globant llega a $8,500/mes en roles de lead.


Certificado MDT

Categoría Corta 80h · Avalado por el Ministerio del Trabajo del Ecuador

Operador: ITSEIA ACADEMY S.A.S. · RUC 1793233739001

Modalidad: Virtual · Área: 06 — Informática y Comunicación

Incluye además: constancia de 2 sesiones de mentoría 1:1 con Héctor Bolívar Velasco Álvarez y carta de referencia profesional de ITSEIA ACADEMY S.A.S.


Fuentes y referencias verificables

#Referencia
1Géron, A. (2022). Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow (3.a ed.). O'Reilly Media.
2LightGBM 13x más rápido que XGBoost (benchmark Microsoft Research 119M filas): https://www.spaceo.ai/blog/machine-learning-tech-stack/
3"El 80% de los modelos ML nunca llegan a producción": estado conocido del sector MLOps, documentado en múltiples fuentes académicas y de industria.
4FastAPI como estándar de despliegue de modelos ML: https://www.f22labs.com/blogs/10-best-ai-model-deployment-tools/
5Aprender21 (2026). Salario ML engineer Ecuador $50,000/año, Banco Pichincha $4,500-$6,500/mes, Globant $8,500/mes: https://www.aprender21.com/blog/inteligencia-artificial-ecuador-guia-2026
6MLflow: el MLOps más adoptado 2025: https://www.kernshell.com/best-practices-for-scalable-machine-learning-deployment/
7XGBoost dominante en competencias Kaggle datos tabulares: evidencia en Kaggle leaderboards 2024-2026.

*ITSEIA ACADEMY S.A.S. — Instituto Ecuatoriano de Inteligencia Artificial*

*itseia.ai · administracion@itseia.ai · WhatsApp 0997489821*

*Inscripciones: itseia.ai/cursos · Abril 2026*