Elige tu nivel

3 niveles del mismo curso · cada uno con más profundidad y proyectos. Pulsa "Ver contenido" para ver módulos, herramientas y salida laboral.

Machine Learning Aplicado a Negocios — Express (40h · $99)

Operador: ITSEIA ACADEMY S.A.S. (RUC 1793233739001)

Coordinador Pedagógico: Héctor Bolívar Velasco Álvarez

Modalidad: Virtual · Área MDT: 06 — Informática y Comunicación

Estructura: 4 módulos × 5 temas × 2 horas por tema = 40h totales

Para quién es (4 perfiles)

Analistas de datos que ya conocen Python básico y Pandas, y quieren construir sus primeros modelos predictivos de Machine Learning con Scikit-learn
Científicos de datos junior que buscan dominar el stack esencial de ML supervisado: regresión, clasificación y evaluación de modelos, con proyectos sobre datos empresariales ecuatorianos
Profesionales de banca, finanzas y telecomunicaciones que trabajan en proyectos de predicción de churn, scoring crediticio o detección de fraude y quieren construir los modelos ellos mismos
Desarrolladores de software que quieren especializarse en ML/AI para acceder a roles de mayor remuneración en el mercado ecuatoriano y LATAM

Objetivo general

Formar a los participantes en los fundamentos teóricos y prácticos del Machine Learning supervisado aplicado a contextos empresariales, capacitándolos para construir y evaluar modelos de regresión y clasificación que resuelvan problemas reales de negocio como predicción de ventas, detección de fraude y clasificación de clientes, utilizando Python y Scikit-learn. El participante cubre el ciclo completo de ML supervisado: preparación de datos, modelado, evaluación y presentación de resultados con impacto de negocio.

Módulos y temas

Módulo 1: Fundamentos de Machine Learning (10h)

#	Tema	Horas	Lo que vas a aprender
1.1	Qué es el Machine Learning y cómo lo usan las empresas ecuatorianas	2h	Definición de ML y diferencia con la IA tradicional; tipos de ML: supervisado, no supervisado y por refuerzo; casos reales en Ecuador: Banco Pichincha en scoring crediticio, Corporación Favorita en predicción de demanda, telecomunicaciones en predicción de churn; ecosistema ML en Python con Scikit-learn
1.2	Ciclo de vida de un proyecto de ML	2h	Las 7 fases de un proyecto de ML: pregunta de negocio, datos, preparación, modelado, evaluación, interpretación y presentación; cómo se diferencia el trabajo de un científico de datos del de un analista; documentación de decisiones en cada fase; herramientas del ecosistema ML en Python
1.3	Preparación de datos para modelado	2h	División de datos en train/test/validation y por qué es crítico hacerlo bien; técnicas de muestreo: estratificado para clases desbalanceadas; encoding de variables categóricas: Label Encoding y One-Hot Encoding; feature scaling: por qué algunos algoritmos lo requieren; ejercicio práctico: preparar un dataset de clientes ecuatorianos para el primer modelo
1.4	Métricas de evaluación de modelos	2h	Métricas para regresión: RMSE, MAE, R², MAPE — cuál usar según el contexto de negocio; métricas para clasificación: accuracy, precision, recall, F1-score — cuál priorizar según el costo del error; matrices de confusión: cómo leerlas y qué significan para el negocio; curvas ROC/AUC: interpretación para audiencias no técnicas
1.5	Sesgo vs. varianza, overfitting y validación cruzada	2h	El dilema sesgo-varianza explicado con ejemplos de negocio; qué es el overfitting y por qué destruye los modelos en producción; validación cruzada k-fold para estimar el rendimiento real; cómo saber si tu modelo generalizará bien a datos nuevos; ejercicio práctico: detectar y corregir overfitting en un modelo de clasificación

Módulo 2: Aprendizaje Supervisado — Regresión (10h)

#	Tema	Horas	Lo que vas a aprender
2.1	Regresión lineal simple y múltiple	2h	Concepto de regresión y cuándo usarla; regresión lineal simple con una variable predictora; regresión múltiple con varias variables; interpretación de coeficientes en lenguaje de negocio; supuestos del modelo lineal y cómo verificarlos; ejercicio: primer modelo de regresión con datos de ventas ecuatorianas
2.2	Regularización: Ridge, Lasso y ElasticNet	2h	Por qué la regresión lineal simple se sobreajusta con muchas variables; Ridge (L2): penaliza coeficientes grandes; Lasso (L1): elimina variables irrelevantes automáticamente; ElasticNet: combinación de Ridge y Lasso; cuándo usar cada uno en proyectos de negocio; ejercicio práctico: predicción de precios de arriendo en Quito con regularización
2.3	Feature engineering para mejorar modelos	2h	Creación de nuevas variables a partir de las existentes; interacciones entre variables; variables polinómicas para capturar relaciones no lineales; variables de fecha: mes, día de la semana, temporada; ejercicio práctico: mejorar el modelo de predicción de ventas con feature engineering contextualizado en Ecuador (feriados, temporadas)
2.4	Evaluación y diagnóstico de modelos de regresión	2h	Análisis de residuos: distribución, homocedasticidad, autocorrelación; gráficos de diagnóstico: residuos vs. valores ajustados, QQ-plot; detección de puntos de influencia (outliers que distorsionan el modelo); cómo presentar el rendimiento de un modelo a una audiencia de negocio con RMSE en unidades reales
2.5	Proyecto de regresión: predicción de ventas retail Ecuador	2h	Construcción completa de un modelo de predicción de ventas mensuales para empresa retail ecuatoriana; feature engineering con estacionalidad y feriados del Ecuador (Navidad, Carnaval, Semana Santa); evaluación con RMSE objetivo menor al 15% de la venta promedio; presentación ejecutiva del modelo con impacto económico cuantificado

Módulo 3: Aprendizaje Supervisado — Clasificación (10h)

#	Tema	Horas	Lo que vas a aprender
3.1	Regresión logística y árboles de decisión	2h	Regresión logística: el modelo de clasificación de referencia; por qué empezar siempre con el modelo más simple; árboles de decisión: interpretables y visualizables para directivos; profundidad máxima y criterios de parada; visualización del árbol con sklearn; ejercicio: clasificador de riesgo crediticio básico
3.2	Random Forest y métodos de ensemble básicos	2h	Por qué un bosque de árboles aleatorios supera a un solo árbol; bagging: la idea detrás de Random Forest; feature importance: cómo saber qué variables importan más; manejo nativo de valores faltantes y variables categóricas; ejercicio: detector de transacciones fraudulentas con Random Forest sobre datos del sistema financiero ecuatoriano
3.3	Support Vector Machines, KNN y Naive Bayes	2h	SVM: el hiperplano que separa clases — cuándo usarlo; K-Nearest Neighbors: el clasificador por vecindad — ventajas y limitaciones; Naive Bayes: velocidad y eficiencia para texto y categorías; cuándo elegir cada algoritmo según el tipo de problema y el volumen de datos
3.4	Matrices de confusión, ROC/AUC y selección de modelo	2h	Matriz de confusión completa: TP, TN, FP, FN; precision vs. recall: cuándo priorizar cada uno según el costo del error en el negocio; curva ROC y AUC para comparar modelos sin depender del umbral; selección del mejor modelo según el costo del error de negocio: ¿qué es peor, un falso positivo o un falso negativo?
3.5	Proyecto de clasificación: scoring crediticio en cooperativas Ecuador	2h	Construcción de un clasificador de riesgo crediticio con datos representativos de cooperativas ecuatorianas de ahorro y crédito (SEPS); comparativa árbol de decisión vs. Random Forest; análisis completo de curva ROC/AUC; objetivo: F1-score mayor a 0.75; presentación ejecutiva con recomendación justificada del modelo para implementar

Módulo 4: Proyecto de ML Aplicado (10h)

#	Tema	Horas	Lo que vas a aprender
4.1	Definición del problema y métricas de éxito	2h	Cómo convertir una pregunta de negocio en un proyecto de ML; definición de la métrica de éxito del modelo en términos de negocio (no solo de estadística); identificación de datos disponibles y sus limitaciones; planificación del proyecto en 5 etapas con tiempos estimados
4.2	Preparación del dataset y análisis exploratorio	2h	Limpieza y preparación del dataset del proyecto final; EDA específico para ML: distribuciones, correlaciones, desbalance de clases; feature engineering inicial; estrategia de validación: train/test split o validación cruzada según el tamaño del dataset
4.3	Modelado baseline y comparativa de algoritmos	2h	Construcción del modelo baseline (siempre empezar por el más simple); implementación de al menos 2 algoritmos adicionales; comparativa sistemática con métricas consistentes; análisis de errores: dónde falla cada modelo y por qué; selección del mejor modelo con justificación técnica
4.4	Interpretación de resultados con impacto de negocio	2h	Traducción de las métricas del modelo a impacto de negocio cuantificado (USD, tiempo, reducción de errores); feature importance para comunicar qué variables son más relevantes; gráficos interpretables para audiencias directivas; cálculo del ROI esperado de la implementación del modelo
4.5	Presentación ejecutiva del proyecto ante la clase	2h	Estructura de la presentación de resultados de ML para directivos: problema, datos, modelo, resultados, recomendación; presentación de 10 minutos ante la clase con retroalimentación del instructor; documentación del notebook con markdown profesional; próximos pasos para llevar el modelo a producción

Proyectos prácticos

#	Proyecto	Dataset / Fuente	Métrica de éxito	Entregable
1	Predicción de ventas mensuales — empresa retail Ecuador	Datos de ventas con estacionalidad y feriados ecuatorianos (Navidad, Carnaval, Semana Santa)	RMSE menor al 15% de la venta promedio mensual	Modelo de regresión documentado + informe de coeficientes en lenguaje de negocio
2	Clasificador de riesgo crediticio en cooperativas	Datos representativos de cooperativas de ahorro y crédito (estructura SEPS)	F1-score mayor a 0.75 con análisis ROC/AUC completo	Comparativa árbol de decisión vs. Random Forest con recomendación justificada
3	Proyecto final a elección: churn, fraude o segmentación	Datos propios del participante o dataset de Kaggle sobre el sector elegido	Impacto económico estimado cuantificado en USD + métricas técnicas documentadas	Notebook Jupyter + presentación ejecutiva de 10 diapositivas ante la clase
4	Contextualización Ecuador: análisis de caso real	Banco Pichincha, Produbanco o cooperativas del sector financiero ecuatoriano	Propuesta de mejora del modelo actual basada en los algoritmos del curso	Informe de 1 página con oportunidad identificada y mejora propuesta con ROI estimado

Herramientas

Herramienta	Versión 2026	Para qué
Scikit-learn	1.5+	Framework ML completo: API consistente para todos los modelos
Pandas + NumPy	2.x / 2.x	Preparación y manipulación de datos para ML
Matplotlib + Seaborn	3.x / 0.13+	Visualización de resultados y curvas ROC
Jupyter Notebook / Google Colab	2026	Entorno interactivo de experimentación y documentación
GitHub	2026	Control de versiones y portafolio de proyectos
Kaggle	2026	Datasets públicos y benchmarking de modelos

Metodología y evaluación

Formato: 60% sesiones sincrónicas en vivo con live-coding + 40% práctica asincrónica en notebooks con datos Ecuador

Distribución de la evaluación:

Componente	Peso
Módulo 1: Quiz conceptual de ML y ejercicios de preparación de datos	15%
Módulo 2: Proyecto de regresión con métricas documentadas y presentación de negocio	25%
Módulo 3: Proyecto de clasificación con análisis comparativo de modelos	30%
Módulo 4: Proyecto final aplicado (propuesta, desarrollo, presentación ejecutiva)	20%
Participación activa en sesiones sincrónicas y foros asincrónicos	10%
TOTAL	100%

Asistencia mínima requerida: 70% (28 horas de 40)
Calificación mínima de aprobación: 70/100
Sistema de calificación: escala 0–100

Salida laboral Ecuador 2026

Rol	Salario inicial	Senior	Empresas
Científico de Datos Junior (ML)	$1,500/mes	$2,500/mes	Banco Pichincha, Produbanco, cooperativas de ahorro
Analista de Modelos Predictivos	$1,200/mes	$2,000/mes	Corporación Favorita, Claro, Movistar
Especialista en ML (freelance)	$40/hora	$80/hora	PYMEs, exportadoras, startups tech
Analista de Riesgo con ML (banca)	$1,400/mes	$2,200/mes	Bancos privados, aseguradoras, fintech Ecuador

Sectores con mayor demanda: banca y finanzas (scoring crediticio, detección de fraude), telecomunicaciones (predicción de churn), retail (predicción de demanda), agroindustria (rendimiento de cultivos).

Certificado MDT

Categoría Corta 40h · Avalado por el Ministerio del Trabajo del Ecuador

Operador: ITSEIA ACADEMY S.A.S. · RUC 1793233739001

Modalidad: Virtual · Área: 06 — Informática y Comunicación

Fuentes y referencias verificables

#	Referencia
1	Géron, A. (2022). Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow (3.a ed.). O'Reilly Media.
2	Scikit-learn developers (2025). Documentación oficial de Scikit-learn 1.5. https://scikit-learn.org/stable/
3	SEPS (2026). Estadísticas del sector cooperativista ecuatoriano. https://www.seps.gob.ec/
4	Aprender21 (2026). Salario ML engineer Ecuador $50,000/año promedio. https://www.aprender21.com/blog/inteligencia-artificial-ecuador-guia-2026
5	Nucamp (2026). Top 10 empresas tech Ecuador: Banco Pichincha, Globant. https://www.nucamp.co/blog/coding-bootcamp-ecuador-ecu-top-10-tech-companies-to-work-for-in-ecuador-in-2025

*ITSEIA ACADEMY S.A.S. — Instituto Ecuatoriano de Inteligencia Artificial*

*itseia.ai · administracion@itseia.ai · WhatsApp 0997489821*

*Inscripciones: itseia.ai/cursos · Abril 2026*

Machine Learning Aplicado a Negocios — Estándar (60h · $197)

Operador: ITSEIA ACADEMY S.A.S. (RUC 1793233739001)

Coordinador Pedagógico: Héctor Bolívar Velasco Álvarez

Modalidad: Virtual · Área MDT: 06 — Informática y Comunicación

Estructura: 6 módulos × 5 temas × 2 horas por tema = 60h totales

Para quién es (4 perfiles)

Analistas de datos con conocimientos de Python y Pandas que quieren dominar el stack completo de Machine Learning: modelos supervisados, no supervisados, métodos ensemble y series temporales, aplicados a casos reales del mercado ecuatoriano
Profesionales de banca, telecomunicaciones y retail (Banco Pichincha, Produbanco, cooperativas de ahorro, Claro, Movistar, Corporación Favorita) que trabajan en proyectos de predicción de churn, detección de fraude, segmentación de clientes u optimización de inventarios y quieren construir modelos propios
Ingenieros y analistas de datos que quieren ampliar sus capacidades hacia modelos avanzados con XGBoost, LightGBM y pronóstico temporal con Prophet, las herramientas más demandadas en ofertas de trabajo de datos en Ecuador y LATAM en 2026
Científicos de datos junior que buscan completar el ciclo de ML — desde el modelado hasta la presentación de resultados con impacto de negocio medible — y construir un portafolio con proyectos sobre datos ecuatorianos reales

Objetivo general

Desarrollar competencias sólidas en Machine Learning aplicado a problemas reales de negocios ecuatorianos, construyendo y evaluando modelos predictivos de regresión, clasificación, clustering y series temporales con el stack profesional 2026: Scikit-learn 1.5, XGBoost, LightGBM, Optuna y Prophet. El participante egresa capaz de seleccionar el algoritmo más adecuado para cada tipo de problema empresarial, optimizar hiperparámetros de forma sistemática, interpretar los resultados con herramientas de explicabilidad (SHAP) y presentar el impacto de negocio de sus modelos a audiencias ejecutivas no técnicas.

Módulos y temas

Módulo 1: Fundamentos de Machine Learning para Negocios (10h)

#	Tema	Horas	Lo que vas a aprender
1.1	ML en empresas ecuatorianas: casos reales y ecosistema	2h	Por qué empresas ecuatorianas ya usan ML: Banco Pichincha en fraude, Corporación Favorita en predicción de demanda, Claro en predicción de churn; tipos de ML: supervisado, no supervisado, por refuerzo; ciclo de vida de un proyecto de ML en una empresa desde la pregunta de negocio hasta la recomendación accionable
1.2	Preparación del entorno profesional de ML	2h	Anaconda, Jupyter Notebook, Google Colab; instalación de Scikit-learn, XGBoost, LightGBM, SHAP y Optuna; configuración de un proyecto de ML con estructura de carpetas; primer notebook de ML configurado y listo para trabajar
1.3	División de datos y validación cruzada	2h	Train/test/validation split: por qué el orden importa en datos con temporalidad; estratificación para clases desbalanceadas; validación cruzada k-fold: cómo estimar el rendimiento real del modelo; fuga de datos (data leakage): el error más caro y cómo evitarlo; ejercicio práctico: dividir correctamente un dataset de churn ecuatoriano
1.4	Métricas de evaluación según el problema de negocio	2h	Métricas de regresión: RMSE, MAE, R², MAPE en unidades de negocio; métricas de clasificación: accuracy, precision, recall, F1-score — cuál usar según el costo del error; AUC-ROC para comparar modelos independientemente del umbral; cómo presentar métricas técnicas a directivos sin que los aburran
1.5	Scikit-learn: la API consistente del ecosistema ML	2h	Por qué Scikit-learn sigue siendo el estándar para datos tabulares en 2026; filosofía fit/transform/predict: cambiar de modelo es cambiar una línea de código; Pipelines de Scikit-learn para evitar fuga de datos; ColumnTransformer para preprocesar diferentes tipos de columnas; construcción del primer pipeline de ML completo

Módulo 2: Aprendizaje Supervisado — Regresión para Predicción Numérica (10h)

#	Tema	Horas	Lo que vas a aprender
2.1	Regresión lineal: supuestos, implementación y diagnóstico	2h	Regresión lineal simple y múltiple; supuestos del modelo lineal: linealidad, homocedasticidad, independencia; análisis de residuos para detectar violaciones; interpretación de coeficientes en lenguaje de negocio; ejercicio: predicción de precios de arriendo de vivienda en Quito por sector (Cumbayá, Norte, Sur, Valle de los Chillos)
2.2	Regularización: Ridge, Lasso y ElasticNet	2h	Por qué la regresión lineal falla con muchas variables; Ridge (L2): reduce todos los coeficientes sin eliminarlos; Lasso (L1): selección automática de variables relevantes; ElasticNet: combinación óptima; ejercicio práctico: regularización sobre dataset de exportaciones ecuatorianas (banano, camarón, flores) con múltiples variables
2.3	Feature engineering para regresión	2h	Creación de variables derivadas: ratios, diferencias y porcentajes; variables de temporalidad: mes, trimestre, año, feriados Ecuador (Navidad, Carnaval, Semana Santa, feriados locales); regresión polinómica para relaciones no lineales; ejercicio: mejorar el modelo de predicción de ventas con variables de calendario ecuatoriano
2.4	Implementación completa con Scikit-learn Pipeline	2h	Pipeline con preprocesamiento + modelo: StandardScaler, OneHotEncoder, GridSearchCV integrados; por qué el Pipeline evita la fuga de datos de validación; validación cruzada dentro del Pipeline; exportación del Pipeline entrenado para reutilización; ejercicio: Pipeline completo para predicción de demanda de exportaciones
2.5	Proyecto de regresión: predicción de ventas con impacto de negocio	2h	Pronóstico de ventas mensuales de empresa retail ecuatoriana: construcción completa del modelo, análisis de errores por período y región, presentación de resultados con RMSE en unidades de negocio (soles/cajas/unidades); cálculo del ahorro en inventario por reducción del error de pronóstico; presentación ante la clase

Módulo 3: Aprendizaje Supervisado — Clasificación para Decisiones de Negocio (10h)

#	Tema	Horas	Lo que vas a aprender
3.1	Regresión logística y árboles de decisión	2h	Regresión logística: el modelo de referencia para clasificación binaria; cuándo la regresión logística es suficiente y cuándo no; árboles de decisión: visualización completa del proceso de decisión para directivos; profundidad máxima, criterio de split y poda; ejercicio: clasificador de mora en créditos de cooperativas ecuatorianas
3.2	Random Forest: el modelo robusto de producción	2h	Por qué Random Forest supera a los árboles individuales; bagging y aleatoriedad de features; importancia de variables (feature importance): comunicar qué factores importan más al negocio; manejo nativo de desbalance de clases; ejercicio: detector de transacciones fraudulentas en el sistema financiero ecuatoriano con análisis de feature importance
3.3	SVM, KNN y Naive Bayes	2h	Support Vector Machines: el hiperplano de margen máximo — cuándo usar con kernel RBF; K-Nearest Neighbors: clasificación por vecindad — sensibilidad al número de vecinos K; Naive Bayes: eficiencia para clasificación de texto y datos categóricos; comparativa de velocidad de entrenamiento e inferencia en datasets de tamaño empresarial ecuatoriano
3.4	Matrices de confusión y umbral de decisión óptimo	2h	Matriz de confusión completa con interpretación de negocio; precision vs. recall: el tradeoff clave — ¿qué es más caro para el negocio, un falso positivo o un falso negativo?; curva Precision-Recall para clases desbalanceadas; curva ROC/AUC para comparar modelos; selección del umbral de decisión óptimo según el costo del error de negocio (fraude bancario: ¿bloquear transacciones legítimas o dejar pasar fraude?)
3.5	Proyecto de clasificación: predicción de churn en telecomunicaciones	2h	Predicción de abandono de clientes (churn) en empresa de telecomunicaciones ecuatoriana; comparativa completa: Regresión Logística vs. Árbol de Decisión vs. Random Forest; análisis ROC/AUC comparativo; selección del umbral de decisión óptimo; propuesta de estrategia de retención por segmento con costo estimado y ROI proyectado

Módulo 4: Aprendizaje No Supervisado — Segmentación y Patrones (10h)

#	Tema	Horas	Lo que vas a aprender
4.1	K-Means y método del codo para clustering	2h	Concepto de clustering: agrupar sin etiquetas; K-Means: el algoritmo más usado en marketing; método del codo (elbow method) para elegir el número óptimo de clusters K; silhouette score para evaluar la calidad del clustering; ejercicio: segmentación inicial de clientes de empresa retail ecuatoriana
4.2	DBSCAN, clustering jerárquico y evaluación	2h	DBSCAN: clusters de forma irregular y detección automática de ruido/outliers; clustering jerárquico con dendrogramas: cuándo usarlo; comparativa K-Means vs. DBSCAN vs. jerárquico; silhouette analysis para evaluar y comparar métodos; ejercicio: detección de anomalías en datos de transacciones financieras
4.3	Reducción de dimensionalidad con PCA y t-SNE	2h	Por qué reducir dimensiones: el problema de la maldición de la dimensionalidad; PCA (Análisis de Componentes Principales): proyección lineal, varianza explicada, visualización 2D de datos multidimensionales; t-SNE para visualización no lineal de clusters; ejercicio: visualización de segmentos de clientes en 2D con PCA
4.4	Segmentación RFM: el estándar del retail ecuatoriano	2h	Análisis RFM (Recencia, Frecuencia, Monto): el modelo estándar para segmentación de clientes; construcción de la segmentación RFM con K-Means; identificación de al menos 4 segmentos accionables: VIP, en riesgo, nuevos de potencial e inactivos; propuesta de campaña de marketing diferenciada por segmento con presupuesto y ROI estimado
4.5	Detección de anomalías e interpretación de segmentos	2h	Isolation Forest para detección de anomalías multivariable; reglas de asociación con Apriori: "quienes compran X también compran Y" — market basket analysis para retail ecuatoriano; interpretación de segmentos en términos de negocio; presentación de la segmentación ante directivos: cómo hacer accionable el clustering

Módulo 5: Métodos Ensemble y Optimización — el Salto a Alto Rendimiento (10h)

#	Tema	Horas	Lo que vas a aprender
5.1	Gradient Boosting: XGBoost en producción empresarial	2h	Por qué los métodos ensemble ganan en datos tabulares; Bagging vs. Boosting: la diferencia fundamental; Gradient Boosting: la idea de corregir errores iterativamente; XGBoost: el modelo más usado en producción empresarial; implementación completa con XGBoost sobre datos de churn ecuatoriano
5.2	LightGBM y CatBoost: velocidad y variables categóricas	2h	LightGBM: entrenamiento 13x más rápido que XGBoost en datasets con millones de filas (benchmark Microsoft Research con 119M de filas); CatBoost: manejo nativo de variables categóricas sin encoding manual; cuándo usar XGBoost, LightGBM o CatBoost según el proyecto; comparativa de velocidad y métricas en dataset ecuatoriano de alto volumen
5.3	Optuna: optimización automática de hiperparámetros	2h	Por qué la búsqueda manual de hiperparámetros no escala; Grid Search y Random Search: sus limitaciones; Optuna: búsqueda bayesiana con pruning inteligente (elimina experimentos malos temprano); configuración del espacio de búsqueda para XGBoost y LightGBM; ejercicio práctico: optimizar el modelo de churn con Optuna hasta superar el baseline
5.4	SHAP: explicabilidad de modelos para directivos	2h	Por qué la explicabilidad es crítica para reguladores y directivos en 2026; SHAP (SHapley Additive exPlanations): teoría de juegos aplicada a ML; gráficos de barras de feature importance global con SHAP; gráficos de fuerza para explicar predicciones individuales; beeswarm plots para el impacto de cada variable; caso práctico: explicar qué lleva a un cliente a hacer churn en telecomunicaciones Ecuador
5.5	Pipeline completo XGBoost + Optuna + SHAP con datos Ecuador	2h	Construcción del pipeline completo: preprocesamiento → XGBoost → Optuna → SHAP → informe ejecutivo; predicción de churn en empresa de telecomunicaciones ecuatoriana; análisis SHAP completo con gráficos listos para presentar a directivos; recomendación de estrategia de retención basada en los factores más influyentes identificados por SHAP

Módulo 6: ML para Series Temporales + Proyecto Integrador Ecuador (10h)

#	Tema	Horas	Lo que vas a aprender
6.1	Componentes de series temporales y modelos estadísticos	2h	Componentes: tendencia, estacionalidad, ciclo y ruido; descomposición con statsmodels; estacionariedad y test ADF; modelos ARIMA: identificación de parámetros p, d, q con ACF y PACF; SARIMA para estacionalidad múltiple; ejercicio: decomposición de series de ventas de empresa ecuatoriana
6.2	ARIMA calibrado sobre datos reales de Ecuador	2h	Calibración de ARIMA sobre ventas semanales de cadena de distribución ecuatoriana; validación con walk-forward (simulación de producción real); métricas temporales: MAE, RMSE, MAPE; identificación de las semanas con mayor error (feriados, temporadas); interpretación de los resultados para el equipo de inventarios
6.3	Prophet (Meta): pronóstico robusto con feriados Ecuador	2h	Por qué Prophet fue diseñado para el mundo real: robusto a outliers, días faltantes y cambios de tendencia; configuración del componente de feriados con calendario ecuatoriano oficial (Navidad, Año Nuevo, Carnaval, Semana Santa, Día del Trabajo, independencias, feriados locales); visualización automática de componentes; Prophet vs. ARIMA: cuándo usar cada uno
6.4	Comparativa ARIMA vs. Prophet y proyección de inventarios	2h	Evaluación comparativa de ARIMA vs. Prophet sobre el mismo dataset de ventas ecuatoriano; selección del modelo con mejor MAPE y justificación; proyección de inventario óptimo para reducción de merma: cuánto producto pedir cada semana según el pronóstico; cálculo del ahorro en merma en USD para la empresa
6.5	Proyecto integrador end-to-end: ciclo completo de ML en un negocio Ecuador	2h	El participante aplica el ciclo completo de ML a un problema de negocio real de su sector (banca, retail, salud, agro o telecomunicaciones); desde la preparación de datos hasta el pitch ejecutivo de resultados; pitch de 10 minutos ante la clase con: problema, modelo elegido, métricas técnicas, impacto de negocio cuantificado en USD y recomendación accionable

Proyectos prácticos

#	Proyecto	Dataset / Fuente	Métrica de éxito	Entregable
1	Predicción de precios de vivienda en Quito	Portales inmobiliarios ecuatorianos: sector, m2, habitaciones, parqueaderos	R² mayor a 0.75 con análisis de errores por zona	Modelo interpretable + informe de coeficientes en lenguaje de negocio
2	Detector de transacciones fraudulentas	Datos representativos del sistema financiero ecuatoriano (estructura bancaria)	AUC mayor a 0.90 + recomendación de umbral justificada en costo de negocio	Clasificador Random Forest vs. XGBoost con análisis ROC/AUC completo
3	Segmentación RFM de clientes retail ecuatoriano	Datos de transacciones de empresa retail Ecuador (datos del curso)	Al menos 4 segmentos accionables con propuesta de campaña y ROI proyectado	Mapa de segmentos con PCA 2D + recomendaciones de acción por segmento
4	Predicción de churn con XGBoost + Optuna + SHAP	Datos de telecomunicaciones ecuatorianas (estructura de empresa local)	Pipeline optimizado con Optuna + análisis SHAP con 5 variables más influyentes	Notebook documentado + análisis SHAP listo para directivos + estrategia de retención
5	Pronóstico de ventas: ARIMA vs. Prophet con feriados Ecuador	Ventas semanales de cadena de distribución ecuatoriana + calendario feriados oficiales	Modelo seleccionado con MAPE justificado + ahorro en merma cuantificado en USD	Comparativa técnica + proyección de inventario óptimo + pitch ejecutivo de impacto

Herramientas

Herramienta	Versión 2026	Para qué
Scikit-learn	1.5+	Framework ML completo, API consistente para todos los modelos
XGBoost	2.x	Gradient boosting de alto rendimiento, más usado en producción
LightGBM	4.x	Entrenamiento 13x más rápido en datasets grandes
CatBoost	1.x	Variables categóricas sin encoding, competitivo con XGBoost
Optuna	3.x	Optimización automática de hiperparámetros con pruning inteligente
SHAP	0.45+	Explicabilidad global y local de cualquier modelo
LIME	0.2+	Explicaciones locales de predicciones individuales
Prophet (Meta)	1.1+	Pronóstico temporal con feriados Ecuador incorporados
statsmodels (ARIMA/SARIMA)	0.14+	Modelos estadísticos clásicos para series temporales
Pandas + Polars	2.x / 1.x	Preparación y manipulación de datos para ML
Matplotlib + Seaborn	3.x / 0.13+	Visualización de resultados de modelos
GitHub + Kaggle	2026	Portafolio y benchmarking con la comunidad global de ML

Metodología y evaluación

Formato: 60% sesiones sincrónicas en vivo con live-coding + 40% práctica asincrónica con notebooks de proyectos sobre datos Ecuador

Distribución de la evaluación:

Componente	Peso
Módulo 1: Quiz de fundamentos ML + configuración del entorno	5%
Módulo 2: Modelo de regresión sobre datos Ecuador (R² objetivo >0.75)	15%
Módulo 3: Clasificador con análisis ROC/AUC comparativo y umbral de decisión	15%
Módulo 4: Segmentación RFM con clustering + propuesta de marketing accionable	15%
Módulo 5: Pipeline XGBoost + Optuna con análisis SHAP interpretable	15%
Módulo 6: Pronóstico series temporales + proyecto integrador end-to-end	25%
Participación activa en sesiones sincrónicas y foros asincrónicos	10%
TOTAL	100%

Asistencia mínima: 70% (42 de 60 horas)
Calificación mínima de aprobación: 70/100
Sistema: escala 0-100

Salida laboral Ecuador 2026

Rol	Salario inicial	Senior	Empresas
Científico de Datos Junior-Medio	$1,000/mes	$3,500/mes	Banco Pichincha, Produbanco, Globant Ecuador
Ingeniero de Machine Learning	$1,200/mes	$4,500/mes	Empresas tecnología, sector financiero
Analista de Riesgo con ML	$1,100/mes	$3,500/mes	Bancos, aseguradoras, cooperativas de ahorro
Especialista en Predicción de Demanda	$900/mes	$2,800/mes	Corporación Favorita, distribuidoras, exportadoras
ML Engineer remoto para LATAM	$2,000/mes	$6,000/mes	Empresas extranjeras con talento Ecuador

Los ingenieros de ML en Ecuador ganan en promedio alrededor de $50,000 USD anuales ($4,000/mes), con Banco Pichincha pagando $4,500-$6,500/mes a nivel senior y Globant hasta $8,500/mes en roles de lead (aprender21.com 2026, nucamp.co 2026). El dominio de XGBoost, SHAP y Prophet es el diferenciador más consistente en el mercado.

Certificado MDT

Categoría Corta 60h · Avalado por el Ministerio del Trabajo del Ecuador

Operador: ITSEIA ACADEMY S.A.S. · RUC 1793233739001

Modalidad: Virtual · Área: 06 — Informática y Comunicación

Fuentes y referencias verificables

#	Referencia
1	Géron, A. (2022). Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow (3.a ed.). O'Reilly Media.
2	LightGBM 13x más rápido que XGBoost en 119M filas (benchmark Microsoft Research): https://www.spaceo.ai/blog/machine-learning-tech-stack/
3	Aprender21 (2026). Salario ML engineer Ecuador $50,000/año promedio: https://www.aprender21.com/blog/inteligencia-artificial-ecuador-guia-2026
4	Nucamp (2026). Top 10 tech companies Ecuador: Banco Pichincha $4,500-$6,500/mes, Globant $8,500/mes lead: https://www.nucamp.co/blog/coding-bootcamp-ecuador-ecu-top-10-tech-companies-to-work-for-in-ecuador-in-2025
5	SEPS (2026). Estadísticas del cooperativismo ecuatoriano: https://www.seps.gob.ec/
6	Scikit-learn 2026 sigue siendo referencia para fraud detection, churn y scoring: https://scale.jobs/blog/top-ml-frameworks-job-seekers

*ITSEIA ACADEMY S.A.S. — Instituto Ecuatoriano de Inteligencia Artificial*

*itseia.ai · administracion@itseia.ai · WhatsApp 0997489821*

*Inscripciones: itseia.ai/cursos · Abril 2026*

Machine Learning Aplicado a Negocios — Completo (80h · $297)

Operador: ITSEIA ACADEMY S.A.S. (RUC 1793233739001)

Coordinador Pedagógico: Héctor Bolívar Velasco Álvarez

Modalidad: Virtual · Área MDT: 06 — Informática y Comunicación

Estructura: 8 módulos × 5 temas × 2 horas por tema = 80h totales

Para quién es (4 perfiles)

Científicos de datos que completaron el nivel Estándar y quieren dominar el ciclo completo de ML: desde la preparación de datos hasta el despliegue de un modelo en producción como API REST con FastAPI, con trazabilidad de experimentos con MLflow
Ingenieros de software y desarrolladores Python que quieren especializarse en ML e integrarlo en aplicaciones reales: construir APIs de predicción que otros sistemas consuman, con fundamentos de MLOps y Docker
Profesionales de banca, telecomunicaciones y retail con proyectos de alto impacto (detección de fraude, churn, predicción de demanda) que necesitan no solo el modelo, sino llevarlo a producción de forma reproducible y documentada
Científicos de datos junior que buscan el nivel máximo de formación disponible, con un proyecto real de empresa cliente como cierre del portafolio y mentoría personalizada con Héctor Bolívar Velasco Álvarez

Objetivo general

Completar la formación integral en Machine Learning incorporando el despliegue de modelos en producción mediante APIs REST con FastAPI, la trazabilidad de experimentos con MLflow, introducción a Docker y los conceptos fundamentales de MLOps, la construcción de un portafolio GitHub profesional con proyectos documentados y APIs demostrables, y la resolución de un caso de negocio real de una empresa del ecosistema ITSEIA con mentoría 1:1. El participante egresa con el ciclo completo de ML dominado: desde la pregunta de negocio hasta una API de predicción funcional en producción, con un portafolio público verificable y experiencia en un proyecto empresarial real ecuatoriano.

Módulos y temas

Módulo 1: Fundamentos de Machine Learning para Negocios (10h)

#	Tema	Horas	Lo que vas a aprender
1.1	ML en empresas ecuatorianas y ecosistema profesional	2h	Casos reales: Banco Pichincha en fraude, Corporación Favorita en demanda, Claro en churn; tipos de ML; ciclo de vida de un proyecto en una empresa ecuatoriana; entorno: Anaconda, Jupyter, Google Colab, librerías del stack completo
1.2	Scikit-learn: la API consistente del ecosistema ML	2h	Filosofía fit/transform/predict; cambiar de modelo con una línea de código; Pipelines para evitar fuga de datos; ColumnTransformer para columnas heterogéneas; primer pipeline de ML completo configurado
1.3	División de datos y validación cruzada	2h	Train/test/validation split con temporalidad; estratificación para clases desbalanceadas; validación cruzada k-fold; data leakage: el error más caro en ML; ejercicio práctico: dividir correctamente un dataset de churn ecuatoriano
1.4	Métricas de evaluación y comunicación a directivos	2h	Regresión: RMSE, MAE, R², MAPE en unidades de negocio; clasificación: accuracy, precision, recall, F1-score, AUC-ROC; cómo presentar métricas técnicas a audiencias no técnicas; matrices de confusión en lenguaje de negocio
1.5	Sesgo, varianza, overfitting y diagnóstico de modelos	2h	Dilema sesgo-varianza con ejemplos de negocio; overfitting: por qué destruye los modelos en producción; curvas de aprendizaje para diagnóstico; validación cruzada como estimador honesto del rendimiento real

Módulo 2: Aprendizaje Supervisado — Regresión (10h)

#	Tema	Horas	Lo que vas a aprender
2.1	Regresión lineal: supuestos, diagnóstico e interpretación	2h	Regresión simple y múltiple; supuestos del modelo lineal; análisis de residuos; interpretación de coeficientes para directivos; ejercicio: predicción de precios de arriendo en Quito por sector (Cumbayá, Norte, Sur, Valle de los Chillos)
2.2	Regularización: Ridge, Lasso y ElasticNet	2h	Ridge (L2), Lasso (L1) y ElasticNet; selección automática de variables con Lasso; ejercicio: regularización sobre exportaciones ecuatorianas (banano, camarón, flores) con múltiples variables predictoras
2.3	Feature engineering con contexto Ecuador	2h	Variables derivadas: ratios, diferencias y porcentajes; variables de temporalidad con feriados ecuatorianos (Navidad, Carnaval, Semana Santa, feriados locales); regresión polinómica para relaciones no lineales; mejora del modelo de ventas con variables de calendario ecuatoriano
2.4	Pipeline completo con Scikit-learn	2h	Pipeline con StandardScaler + OneHotEncoder + modelo + validación cruzada; Grid Search integrado en el Pipeline; exportación del Pipeline entrenado para reutilización y despliegue; publicación en GitHub como Repositorio 1 del portafolio
2.5	Proyecto de regresión: predicción de precios vivienda Quito	2h	Regresión regularizada (Ridge/Lasso) para predecir arriendos en Quito; R² objetivo mayor a 0.75; análisis de errores por zona; informe de coeficientes en lenguaje de negocio; publicado en GitHub como Repositorio 1 con gráfico de coeficientes e interpretación

Módulo 3: Aprendizaje Supervisado — Clasificación (10h)

#	Tema	Horas	Lo que vas a aprender
3.1	Regresión logística y árboles de decisión	2h	Regresión logística: modelo de referencia para clasificación binaria; árbol de decisión: visualización completa e interpretable para directivos; poda y profundidad máxima; ejercicio: clasificador de mora en créditos de cooperativas ecuatorianas
3.2	Random Forest: el modelo robusto de producción	2h	Bagging y aleatoriedad de features; feature importance en lenguaje de negocio; manejo nativo de desbalance de clases; ejercicio: detector de fraude bancario con análisis de feature importance — publicado en GitHub como Repositorio 2
3.3	SVM, KNN y Naive Bayes	2h	SVM con kernel RBF para fronteras no lineales; KNN: sensibilidad al número de vecinos; Naive Bayes para categorías; comparativa de velocidad e interpretabilidad según el caso de negocio ecuatoriano
3.4	Matrices de confusión, ROC/AUC y umbral óptimo	2h	Matriz de confusión completa con costos de negocio; precision-recall tradeoff; curva ROC y AUC; selección del umbral de decisión óptimo según el costo del error (fraude: ¿bloquear legítimas o dejar pasar fraude?); curva Precision-Recall para clases desbalanceadas
3.5	Proyecto de clasificación: detector de fraude bancario	2h	Clasificador binario comparando Random Forest vs. XGBoost para fraude en datos representativos del sistema financiero ecuatoriano; análisis ROC/AUC completo; umbral de decisión óptimo justificado en costos de negocio; AUC objetivo mayor a 0.90; publicado en GitHub como Repositorio 2

Módulo 4: Aprendizaje No Supervisado (10h)

#	Tema	Horas	Lo que vas a aprender
4.1	K-Means y evaluación de clustering	2h	K-Means: el algoritmo más usado en marketing; método del codo y silhouette score para elegir K; ejercicio: primera segmentación de clientes de empresa retail ecuatoriana
4.2	DBSCAN y clustering jerárquico	2h	DBSCAN para clusters irregulares y detección de ruido/outliers; clustering jerárquico con dendrogramas; silhouette analysis comparativa; detección de anomalías en transacciones financieras
4.3	Reducción de dimensionalidad: PCA y t-SNE	2h	PCA: proyección lineal, varianza explicada, visualización 2D de segmentos; t-SNE para exploración no lineal; ejercicio: visualización de segmentos de clientes ecuatorianos con PCA — publicado en GitHub como Repositorio 3
4.4	Segmentación RFM y reglas de asociación	2h	Análisis RFM (Recencia, Frecuencia, Monto): estándar del retail ecuatoriano; 4 segmentos accionables: VIP, en riesgo, nuevos de potencial, inactivos; reglas de asociación con Apriori para market basket analysis; propuesta de campaña por segmento con ROI estimado
4.5	Isolation Forest y detección de anomalías	2h	Isolation Forest para anomalías multivariables; aplicación a detección de transacciones sospechosas y fraude sin etiquetas; evaluación de modelos no supervisados; presentación de los segmentos ante la clase como si fuera un equipo de marketing

Módulo 5: Métodos Ensemble y Optimización (10h)

#	Tema	Horas	Lo que vas a aprender
5.1	XGBoost: el más usado en producción empresarial	2h	Gradient Boosting: corregir errores iterativamente; XGBoost: regularización, manejo de nulos, paralelización; implementación completa sobre datos de churn ecuatoriano; comparativa con Random Forest en velocidad y métricas
5.2	LightGBM y CatBoost	2h	LightGBM: 13x más rápido que XGBoost en 119M filas (benchmark Microsoft Research); leaf-wise growth; CatBoost: variables categóricas sin encoding manual; cuándo elegir cada uno; benchmark en dataset ecuatoriano de alto volumen
5.3	Optuna: optimización automática de hiperparámetros	2h	Grid Search y Random Search: sus límites; Optuna: búsqueda bayesiana con pruning (elimina experimentos malos temprano); espacio de búsqueda para XGBoost y LightGBM; ejercicio: optimizar el modelo de churn con Optuna hasta superar el baseline
5.4	SHAP y LIME: explicabilidad para directivos y reguladores	2h	SHAP: teoría de juegos aplicada a ML; feature importance global con gráficos de barras; gráficos de fuerza para predicciones individuales; beeswarm plots; LIME para explicaciones locales; caso: explicar qué lleva a un cliente a hacer churn en telecomunicaciones Ecuador
5.5	Pipeline completo XGBoost + Optuna + SHAP	2h	Pipeline de producción: preprocesamiento → XGBoost → Optuna → SHAP → informe ejecutivo; pipeline de churn con análisis SHAP completo publicado en GitHub como Repositorio 4 con gráficos listos para directivos

Módulo 6: ML para Series Temporales (10h)

#	Tema	Horas	Lo que vas a aprender
6.1	Componentes de series temporales y descomposición	2h	Tendencia, estacionalidad, ciclo y ruido; descomposición con statsmodels; estacionariedad y test ADF; ACF y PACF para identificar parámetros de ARIMA; decomposición de series de ventas de empresa ecuatoriana
6.2	ARIMA calibrado sobre datos Ecuador	2h	ARIMA: calibración de p, d, q con datos reales; SARIMA para estacionalidad múltiple; validación walk-forward; métricas: MAE, RMSE, MAPE; análisis de errores en feriados y temporadas ecuatorianas
6.3	Prophet (Meta) con feriados Ecuador	2h	Configuración del calendario ecuatoriano oficial en Prophet (Navidad, Año Nuevo, Carnaval, Semana Santa, feriados locales); robustez a outliers y datos faltantes; visualización automática de componentes de tendencia y estacionalidad
6.4	Comparativa ARIMA vs. Prophet y proyección de inventarios	2h	Evaluación comparativa en el mismo dataset de ventas Ecuador; selección del modelo con mejor MAPE y justificación técnica; proyección de inventario óptimo para reducción de merma; cálculo del ahorro en merma en USD — publicado en GitHub como Repositorio 5
6.5	Aplicaciones de series temporales en sectores Ecuador	2h	Pronóstico de demanda energética (Ministerio de Energía); predicción de exportaciones ecuatorianas para ProEcuador; análisis de tendencias de precios del banano, cacao y camarón (datos BCE/MAGAP); preparación del dataset de series temporales del proyecto empresa

Módulo 7: Despliegue y Productivización de Modelos — MLOps básico (10h)

#	Tema	Horas	Lo que vas a aprender
7.1	Por qué el 80% de los modelos nunca llegan a producción	2h	El gap entre el notebook y producción; qué es MLOps y por qué cambió la industria; serialización de modelos: pickle y joblib; diferencias entre desplegar un modelo y desplegar una API; planificación del proyecto de despliegue
7.2	MLflow: trazabilidad de experimentos y model registry	2h	Configuración de MLflow localmente; registro automático de métricas, parámetros, hiperparámetros y el modelo; comparativa de experimentos en la UI de MLflow; model registry: versiones, staging y producción; registro del modelo de fraude del módulo 3 en MLflow
7.3	FastAPI: API REST de predicción con documentación automática	2h	Por qué FastAPI es el estándar para despliegue de modelos ML; estructura de una API de predicción: endpoint /predict con schema de entrada/salida; carga del modelo serializado; documentación automática con Swagger UI; manejo de errores y validación de entrada con Pydantic
7.4	Docker: contenedorización del stack ML	2h	Qué es Docker y por qué el modelo en tu computadora no funciona en el servidor; Dockerfile para el modelo + FastAPI; docker build y docker run; docker-compose para modelo + API en un solo comando; ejercicio: contenedorizar la API de fraude para que funcione en cualquier servidor con un solo comando
7.5	Monitoreo de modelos y MLOps: el ciclo completo	2h	Data drift: cuándo los datos cambian y el modelo se deteriora; model drift: cuándo las predicciones dejan de ser válidas; métricas de monitoreo en producción; alertas automáticas; el ciclo completo de MLOps: desde el notebook hasta el modelo monitoreado en producción; API FastAPI del modelo publicada en GitHub como Repositorio 6

Módulo 8: Portafolio GitHub + Caso Real de Empresa + Mentoría 1:1 (10h)

#	Tema	Horas	Lo que vas a aprender
8.1	Construcción del portafolio GitHub profesional	2h	READMEs de alto impacto con métricas, badges de tecnología y links al demo de la API; perfil GitHub optimizado con contribuciones visibles; README maestro que une los 7 repositorios del portafolio; estrategia de posicionamiento en LinkedIn como ML engineer con keywords de la industria 2026
8.2	Acceso al dataset real de empresa y definición del problema	2h	Dataset anonimizado de empresa del ecosistema ITSEIA (banca, retail, salud o agro según perfil del participante); análisis del problema empresarial con contexto de negocio real; definición del alcance, métricas de éxito y plan de entrega
8.3	Ciclo completo de ML sobre datos reales de empresa	2h	Limpieza y preparación del dataset real; modelado con el stack del curso: Scikit-learn + XGBoost/LightGBM + Optuna; análisis SHAP completo; construcción de la API FastAPI del modelo y registro en MLflow
8.4	Mentoría 1:1 — sesiones con Héctor Bolívar Velasco Álvarez	2h	Primera sesión individual de 45 minutos: revisión del portafolio GitHub completo + orientación de carrera personalizada hacia los roles de mayor crecimiento (ML engineer, científico de datos, MLOps); segunda sesión de 45 minutos: feedback del proyecto empresa + presentación ante panel evaluador + orientación sobre oportunidades en el ecosistema de datos Ecuador
8.5	Presentación final y carta de referencia profesional	2h	Presentación del ciclo completo de ML del proyecto empresa ante panel evaluador con al menos un directivo de la empresa cliente; entregables: notebook documentado, API FastAPI con endpoint de predicción, informe ejecutivo con impacto de negocio cuantificado en USD; carta de referencia profesional de ITSEIA ACADEMY S.A.S.; acceso a la red de empresas del ecosistema para oportunidades laborales

Proyectos prácticos

#	Proyecto	Dataset / Fuente	Métrica de éxito	Entregable
1	Predicción de precios de vivienda en Quito	Portales inmobiliarios ecuatorianos por sector	R² mayor a 0.75 + análisis de coeficientes en lenguaje de negocio	Repositorio 1 con README, gráfico de coeficientes y notebook documentado
2	Detector de fraude bancario con análisis ROC	Datos representativos del sistema financiero ecuatoriano	AUC mayor a 0.90 + umbral de decisión justificado en costos	Repositorio 2: Random Forest vs. XGBoost con análisis ROC/AUC completo
3	Segmentación RFM de clientes retail Ecuador	Transacciones de empresa retail ecuatoriana (datos del curso)	4 segmentos accionables + visualización PCA 2D + propuesta de campaña	Repositorio 3: clustering + PCA + propuesta diferenciada por segmento
4	Pipeline churn con XGBoost + Optuna + SHAP	Datos de telecomunicaciones ecuatorianas	Pipeline optimizado + análisis SHAP con 5 variables más influyentes	Repositorio 4: pipeline completo + gráficos SHAP listos para directivos
5	Pronóstico ventas: ARIMA vs. Prophet con feriados Ecuador	Ventas semanales cadena retail + calendario feriados oficiales	MAPE justificado + ahorro en merma cuantificado en USD	Repositorio 5: comparativa técnica + proyección de inventario óptimo
6	API FastAPI del modelo de fraude con MLflow + Docker	Modelo del Repositorio 2	API funcional con Swagger UI + experimento en MLflow + Dockerfile	Repositorio 6: API ejecutable con un solo comando `docker run`
7	Portafolio unificado con README maestro	6 repositorios anteriores + LinkedIn	Perfil GitHub profesional con 6 proyectos, demos y LinkedIn optimizado	README maestro + URL del portafolio + video de 5 minutos presentando el portafolio
8	Proyecto empresa cliente — ciclo ML completo	Dataset real bajo confidencialidad (ecosistema ITSEIA)	Modelo en producción como API + impacto de negocio cuantificado en USD	Notebook + API FastAPI + informe ejecutivo + presentación ante panel con directivo de la empresa

Herramientas

Herramienta	Versión 2026	Para qué
Scikit-learn	1.5+	Framework ML completo, API consistente para todos los modelos
XGBoost	2.x	Gradient boosting de alto rendimiento, más usado en producción
LightGBM	4.x	Entrenamiento 13x más rápido en datasets grandes
CatBoost	1.x	Variables categóricas sin encoding, competitivo con XGBoost
Optuna	3.x	Optimización automática de hiperparámetros con pruning
SHAP	0.45+	Explicabilidad global y local de cualquier modelo
LIME	0.2+	Explicaciones locales de predicciones individuales
Prophet (Meta)	1.1+	Pronóstico temporal con feriados Ecuador incorporados
statsmodels	0.14+	ARIMA/SARIMA para series temporales clásicas
FastAPI	0.110+	APIs REST de modelos ML con Swagger automático
MLflow	2.x	Trazabilidad de experimentos, model registry, reproducibilidad
Docker	26+	Contenedorización del stack ML para despliegue en cualquier servidor
GitHub + GitHub Actions	2026	Portafolio profesional público con CI/CD básico

Metodología y evaluación

Formato: 60% sesiones sincrónicas en vivo con live-coding + 40% práctica asincrónica en notebooks + 2 sesiones de mentoría 1:1

Distribución de la evaluación:

Componente	Peso
Módulos 1–6: Proyectos y evaluaciones del nivel Estándar (promedio)	35%
Módulo 7: API FastAPI funcional con MLflow + contenedor Docker documentado	15%
Módulo 8: Portafolio GitHub (7 repositorios, README maestro, video, LinkedIn)	15%
Módulo 8: Proyecto empresa cliente (ciclo ML completo, API, presentación ejecutiva)	25%
Sesiones de mentoría 1:1 y participación activa	10%
TOTAL	100%

Asistencia mínima: 70% (56 de 80 horas)
Calificación mínima de aprobación: 70/100
Sistema: escala 0-100

Salida laboral Ecuador 2026

Rol	Salario inicial	Senior	Empresas
Científico de Datos Semi-senior	$1,500/mes	$4,500/mes	Banco Pichincha, Produbanco, Globant Ecuador
Ingeniero de Machine Learning	$1,800/mes	$6,000/mes	Empresas financieras, startups, multinacionales
ML Engineer remoto LATAM/USA	$2,500/mes	$8,500/mes	Empresas internacionales con talento remoto Ecuador
Científico de Datos sector financiero	$2,000/mes	$6,500/mes	Bancos privados, aseguradoras, fintech Ecuador
Consultor de ML freelance	$60/hora	$150/hora	PYMEs con proyectos de datos, exportadoras

En 2026, llevar modelos ML a producción confiable es la habilidad más escasa y mejor pagada. Un portafolio GitHub con una API FastAPI funcional, experimentos en MLflow y un proyecto real de empresa es el diferenciador que convierte una entrevista en una oferta de trabajo. Banco Pichincha paga $4,500-$6,500/mes a ingenieros ML senior; Globant llega a $8,500/mes en roles de lead.

Certificado MDT

Categoría Corta 80h · Avalado por el Ministerio del Trabajo del Ecuador

Operador: ITSEIA ACADEMY S.A.S. · RUC 1793233739001

Modalidad: Virtual · Área: 06 — Informática y Comunicación

Incluye además: constancia de 2 sesiones de mentoría 1:1 con Héctor Bolívar Velasco Álvarez y carta de referencia profesional de ITSEIA ACADEMY S.A.S.

Fuentes y referencias verificables

#	Referencia
1	Géron, A. (2022). Hands-On Machine Learning with Scikit-Learn, Keras, and TensorFlow (3.a ed.). O'Reilly Media.
2	LightGBM 13x más rápido que XGBoost (benchmark Microsoft Research 119M filas): https://www.spaceo.ai/blog/machine-learning-tech-stack/
3	"El 80% de los modelos ML nunca llegan a producción": estado conocido del sector MLOps, documentado en múltiples fuentes académicas y de industria.
4	FastAPI como estándar de despliegue de modelos ML: https://www.f22labs.com/blogs/10-best-ai-model-deployment-tools/
5	Aprender21 (2026). Salario ML engineer Ecuador $50,000/año, Banco Pichincha $4,500-$6,500/mes, Globant $8,500/mes: https://www.aprender21.com/blog/inteligencia-artificial-ecuador-guia-2026
6	MLflow: el MLOps más adoptado 2025: https://www.kernshell.com/best-practices-for-scalable-machine-learning-deployment/
7	XGBoost dominante en competencias Kaggle datos tabulares: evidencia en Kaggle leaderboards 2024-2026.

*ITSEIA ACADEMY S.A.S. — Instituto Ecuatoriano de Inteligencia Artificial*

*itseia.ai · administracion@itseia.ai · WhatsApp 0997489821*

*Inscripciones: itseia.ai/cursos · Abril 2026*

Machine Learning Aplicado a Negocios

Cómo reservar tu cupo

Realiza la transferencia bancaria

Envía tu comprobante

Recibe tu acceso en 12 horas

Elige tu nivel

Machine Learning Aplicado a Negocios — Express (40h · $99)

Para quién es (4 perfiles)

Objetivo general

Módulos y temas

Módulo 1: Fundamentos de Machine Learning (10h)

Módulo 2: Aprendizaje Supervisado — Regresión (10h)

Módulo 3: Aprendizaje Supervisado — Clasificación (10h)

Módulo 4: Proyecto de ML Aplicado (10h)

Proyectos prácticos

Herramientas

Metodología y evaluación

Salida laboral Ecuador 2026

Certificado MDT

Fuentes y referencias verificables

Machine Learning Aplicado a Negocios — Estándar (60h · $197)

Para quién es (4 perfiles)

Objetivo general

Módulos y temas

Módulo 1: Fundamentos de Machine Learning para Negocios (10h)

Módulo 2: Aprendizaje Supervisado — Regresión para Predicción Numérica (10h)

Módulo 3: Aprendizaje Supervisado — Clasificación para Decisiones de Negocio (10h)

Módulo 4: Aprendizaje No Supervisado — Segmentación y Patrones (10h)

Módulo 5: Métodos Ensemble y Optimización — el Salto a Alto Rendimiento (10h)

Módulo 6: ML para Series Temporales + Proyecto Integrador Ecuador (10h)

Proyectos prácticos

Herramientas

Metodología y evaluación

Salida laboral Ecuador 2026

Certificado MDT

Fuentes y referencias verificables

Machine Learning Aplicado a Negocios — Completo (80h · $297)

Para quién es (4 perfiles)

Objetivo general

Módulos y temas

Módulo 1: Fundamentos de Machine Learning para Negocios (10h)

Módulo 2: Aprendizaje Supervisado — Regresión (10h)

Módulo 3: Aprendizaje Supervisado — Clasificación (10h)

Módulo 4: Aprendizaje No Supervisado (10h)

Módulo 5: Métodos Ensemble y Optimización (10h)

Módulo 6: ML para Series Temporales (10h)

Módulo 7: Despliegue y Productivización de Modelos — MLOps básico (10h)

Módulo 8: Portafolio GitHub + Caso Real de Empresa + Mentoría 1:1 (10h)

Proyectos prácticos

Herramientas

Metodología y evaluación

Salida laboral Ecuador 2026

Certificado MDT

Fuentes y referencias verificables

📋 Reserva tu cupo · · $