ITSEIA Inicio · Cursos · Ciencia de Datos: Proyectos Re 💬 WhatsApp
Certificado MDT · Ministerio del Trabajo

Ciencia de Datos: Proyectos Reales

3 niveles de profundidad. Modalidad 100% virtual con instructor en vivo. Certificado oficial del Ministerio del Trabajo del Ecuador al aprobar.

3niveles
40-80hpor nivel
$99-297según nivel
MDTcertificado

Cómo reservar tu cupo

3 pasos simples · acceso en menos de 12 horas tras confirmar el pago

1

Realiza la transferencia bancaria

BancoProdubanco
TipoCuenta Corriente
Número27059145711
TitularITSEIA ACADEMY S.A.S.
RUC1793233739001
ConceptoCurso Ciencia de Datos: Proyectos Reales

Acepta Pichincha, Bolivariano, Guayaquil, Banco del Pacífico y otros bancos. Transferencia interbancaria sin recargo desde Produbanco.

2

Envía tu comprobante

Mándanos foto o PDF del comprobante de transferencia por WhatsApp con tu nombre completo, número de cédula y nivel del curso (Express / Estándar / Completo).

📲 Enviar comprobante por WhatsApp
3

Recibe tu acceso en 12 horas

Te entregamos:

  • ✅ Factura electrónica por correo
  • ✅ Credenciales de plataforma tecnologico.itseia.ai
  • ✅ Bienvenida del instructor por WhatsApp
  • ✅ Calendario de inicio del curso

¿Tienes preguntas antes de pagar?

💬 Conversar con asesor por WhatsApp

Elige tu nivel

3 niveles del mismo curso · cada uno con más profundidad y proyectos. Pulsa "Ver contenido" para ver módulos, herramientas y salida laboral.

Ciencia de Datos: Proyectos Reales — Express (40h · $99)

Operador: ITSEIA ACADEMY S.A.S. (RUC 1793233739001)

Coordinador: Héctor Bolívar Velasco Álvarez

Modalidad: Virtual · Área MDT: 06

Estructura: 4 módulos × 5 temas × 2h = 40h


Para quién es (perfiles SENIOR)

Profesionales con conocimientos básicos de Python que quieren ejecutar su primer pipeline completo de datos — desde una API hasta un dashboard en Power BI — en el menor tiempo posible. Ideal para analistas de negocios, contadores o administradores que quieren complementar su perfil con herramientas de datos.

Perfiles típicos:

  • Analistas financieros que quieren automatizar reportes con Python
  • Administradores que quieren pasar de Excel a Pandas y Power BI
  • Profesionales con Python básico que apuntan a roles de $650–$1,100/mes en Ecuador

Objetivo general

Ejecutar un pipeline completo de datos: obtener datos desde una API, procesarlos con Python, analizarlos estadísticamente y visualizarlos en un dashboard de Power BI — usando datos reales del contexto ecuatoriano (BCE, SRI, MAGAP).


Módulos y temas

Módulo 1: Python intermedio para datos (10h)

#TemaHorasAprenderás
1.1Programación funcional: map, filter, lambda y comprehensions2hAplicar map, filter, lambda, list comprehensions y dict comprehensions para procesar colecciones de datos empresariales
1.2Manejo de archivos: CSV, JSON, Excel y Parquet con Pandas2hLeer y escribir CSV, JSON, Excel y Parquet con Pandas; gestionar rutas, encodings y formatos con fechas
1.3Consumo de APIs REST con Requests: autenticación y paginación2hConsumir APIs públicas del BCE y SRI con Requests, manejar autenticación Bearer, paginación y errores HTTP
1.4Pandas avanzado: merge, groupby, pivot_table y apply2hCombinar DataFrames con merge, agrupar con groupby y funciones múltiples, crear pivot tables y aplicar funciones personalizadas
1.5Control de versiones con Git y GitHub para ciencia de datos2hGestionar proyectos con Git, crear commits semánticos, publicar repositorios en GitHub con README profesional

Módulo 2: Matemáticas para Machine Learning (10h)

#TemaHorasAprenderás
2.1Derivadas: regla de la cadena y derivadas parciales con SymPy2hCalcular derivadas simples y parciales con SymPy, entender la intuición del gradiente como dirección de mayor cambio
2.2Gradiente descendente: implementación paso a paso en Python2hImplementar gradiente descendente desde cero en Python, visualizar la convergencia con Matplotlib
2.3Función de costo MSE y cross-entropy: qué significa minimizarlas2hDerivar e implementar funciones de costo MSE y cross-entropy, conectar con el aprendizaje de modelos de ML
2.4Descenso estocástico por mini-lotes (SGD): por qué lo usan las redes2hComparar batch, mini-batch y SGD, visualizar diferencias en convergencia sobre una función de costo simple
2.5Visualización 3D de superficies de costo y curvas de convergencia2hCrear visualizaciones 3D de superficies de costo con Matplotlib, interpretar curvas de aprendizaje en modelos de ML

Módulo 3: Estadística aplicada a datos (10h)

#TemaHorasAprenderás
3.1Estadística descriptiva completa: distribuciones y outliers2hCalcular medidas de tendencia central, dispersión, asimetría y curtosis; detectar outliers con IQR y z-score
3.2Distribuciones de probabilidad para datos empresariales2hTrabajar con distribuciones normal, t-Student, Poisson y binomial en Python/SciPy sobre datos reales ecuatorianos
3.3Pruebas de hipótesis básicas: t-test y chi-cuadrado2hFormular y ejecutar t-test de una muestra y chi-cuadrado de independencia con SciPy; interpretar p-valor
3.4Correlación de Pearson y regresión lineal simple2hCalcular correlaciones de Pearson entre variables de negocio, ajustar regresión lineal simple con NumPy y Statsmodels
3.5SQL esencial + Power BI: de datos a dashboard en 2 horas2hEjecutar SELECT/JOIN/GROUP BY sobre base de datos de negocio, importar en Power BI, crear medidas DAX básicas

Módulo 4: Mini-proyecto integrador — Pipeline completo Ecuador (10h)

#TemaHorasAprenderás
4.1Diseño del pipeline: API → Pandas → base de datos → Power BI2hArquitecturar el pipeline completo de datos, diagramar el flujo de datos y definir las transformaciones necesarias
4.2Extracción de datos: API del BCE y SRI2hConsumir la API pública del Banco Central del Ecuador, extraer datos macroeconómicos y limpiar con Pandas
4.3Análisis estadístico: hipótesis sobre indicadores ecuatorianos2hEjecutar t-test y correlación sobre indicadores del BCE, formular hipótesis sobre inflación y crecimiento del PIB
4.4Base de datos PostgreSQL y modelo de datos2hDiseñar y poblar una base de datos en PostgreSQL, normalizar hasta 3FN, ejecutar consultas de análisis con SQL
4.5Dashboard Power BI con 8+ KPIs y README en GitHub2hConstruir dashboard interactivo con medidas DAX, publicar en Power BI Service, documentar en GitHub con README

Proyectos prácticos (proyectos avanzados con caso real Ecuador)

Proyecto integrador — Pipeline macroeconómico Ecuador

Sector: Sector financiero y político-económico Ecuador (Banco Central del Ecuador — indicadores públicos)

Dataset: API pública del BCE (inflación mensual, tasas de interés, balanza comercial, remesas 2015–2024)

Caso real: Sistema de monitoreo de indicadores macroeconómicos que cualquier empresa o ministerio podría usar para planificación

Arquitectura: Python + Requests (API BCE) + Pandas (limpieza) + gradiente descendente para proyección + PostgreSQL + Power BI

Métricas de éxito: Pipeline reproducible en 1 clic, dashboard con 8+ KPIs interactivos, README con documentación completa


Herramientas (enterprise-grade 2026)

Python 3.11+, Pandas, NumPy, Requests, SymPy, Matplotlib, SciPy, Statsmodels, VS Code, Jupyter Notebook, GitHub, PostgreSQL, SQLite, DBeaver, Power BI Desktop, DAX (SUM, AVERAGE, CALCULATE, FILTER)


Metodología

  • **Pipeline-first:** cada módulo construye una pieza del pipeline end-to-end
  • **Casos Ecuador-first:** datos de fuentes públicas ecuatorianas (BCE, SRI, MAGAP, INEC)
  • **GitHub-first:** commits semánticos desde el Módulo 1
  • **65% práctico:** cada sesión de 2h incluye mínimo 70 minutos de código aplicado

Distribución de evaluación

ComponentePeso
Entregables de módulos 1–3 (código funcional por módulo)60%
Mini-proyecto integrador (pipeline funcional + dashboard Power BI)30%
Participación en sesiones y foros10%
**TOTAL****100%**

Calificación mínima de aprobación: 70/100. Asistencia mínima: 70% (28 horas de 40).


Salida laboral Ecuador 2026 (roles SENIOR con portafolio)

RolEmpresa/SectorRango salarial referencial
Analista de datos juniorBanco Pichincha, SRI, Ministerio de Economía$650–$1,100/mes
Asistente de BICorporación Favorita, CNT, Claro Ecuador$700–$1,000/mes
Analista de operaciones con datosEmpresas retail y telecomunicaciones$600–$950/mes

Fuente referencial: multitrabajos.com, LinkedIn Ecuador (perfiles activos 2026).


Certificado MDT

Certificado de aprobación — "Ciencia de Datos: Proyectos Reales Express (40h)" emitido por ITSEIA ACADEMY S.A.S. bajo registro del Ministerio de Trabajo del Ecuador (MDT). Válido para hoja de vida, concursos de méritos y procesos de contratación en sector público y privado.

Fuentes verificables

  • BCE Ecuador: API pública de indicadores macroeconómicos — www.bce.fin.ec
  • SRI Ecuador: datos de recaudación tributaria pública — www.sri.gob.ec
  • MAGAP: rendimientos agrícolas — www.agricultura.gob.ec
  • Power BI Microsoft: documentación DAX — learn.microsoft.com/power-bi
  • Glassdoor Ecuador 2025: rangos salariales referencial — www.glassdoor.com

*Operador: ITSEIA ACADEMY S.A.S. — RUC 1793233739001*

*Coordinador pedagógico: Héctor Bolívar Velasco Álvarez*

*Modalidad virtual · Precio: $99 · 40 horas · Área MDT: 06 — Informática y Comunicación*

Ciencia de Datos: Proyectos Reales — Estándar (60h · $197)

Operador: ITSEIA ACADEMY S.A.S. (RUC 1793233739001)

Coordinador: Héctor Bolívar Velasco Álvarez

Modalidad: Virtual · Área MDT: 06

Estructura: 6 módulos × 5 temas × 2h = 60h


Para quién es (perfiles SENIOR)

Analistas, administradores de empresas, contadores y profesionales con Python básico que quieren construir un perfil sólido de Data Scientist junior-senior en Ecuador. Orientado a quienes necesitan combinar programación, matemáticas aplicadas, estadística inferencial y herramientas de BI en proyectos reales documentados que abran puertas a roles de $1,200–$2,000/mes en el mercado ecuatoriano.

Perfiles típicos:

  • Analistas de datos o financieros que quieren automatizar con Python y publicar en Power BI
  • Administradores que quieren liderar proyectos de analítica en su organización
  • Profesionales del sector público (SRI, BCE, INEC) que trabajan con datos
  • Emprendedores que quieren tomar decisiones basadas en datos en sus negocios

Objetivo general

Consolidar competencias intermedias-avanzadas de Python para datos, matemáticas aplicadas al aprendizaje automático, estadística inferencial rigurosa y herramientas de BI profesionales — ejecutando 3 pipelines reales del contexto ecuatoriano (sector tributario, agrícola y macroeconómico) que demuestren capacidad de entrega para roles de Data Scientist o analista de BI senior en Ecuador 2026.


Módulos y temas

Módulo 1: Python avanzado para ciencia de datos (10h)

#TemaHorasAprenderás
1.1Programación funcional completa y generators2hDominar map, filter, reduce, lambda, comprehensions de listas/dicts/sets y generators para procesamiento eficiente de datos
1.2Pandas avanzado: merge, groupby, pivot_table y transform2hCombinar DataFrames con todos los tipos de join, agrupar con agg múltiple, crear pivot tables y aplicar transform
1.3APIs REST con Requests: paginación, autenticación y manejo de errores2hConsumir APIs del BCE y SRI con autenticación Bearer, manejar paginación, reintentos y errores HTTP con logging
1.4Formatos de datos avanzados: Parquet, XML y virtual environments2hLeer y escribir Parquet y XML, gestionar entornos virtuales con venv y pip, documentar dependencias en requirements.txt
1.5PEP 8, buenas prácticas y flujo colaborativo en GitHub2hAplicar PEP 8 con flake8, gestionar ramas en GitHub, escribir PRs descriptivos y crear commits semánticos

Módulo 2: Matemáticas aplicadas al Machine Learning (10h)

#TemaHorasAprenderás
2.1Derivadas parciales y cálculo integral aplicado con SymPy2hCalcular derivadas parciales y gradientes con SymPy, interpretar integrales definidas como área bajo la curva de probabilidad
2.2Gradiente descendente: implementación desde cero con visualización2hImplementar gradiente descendente batch con Python, visualizar convergencia en superficie 3D con Matplotlib
2.3SGD y Adam conceptual: por qué el mini-batch acelera el aprendizaje2hComparar batch vs. mini-batch vs. SGD, entender momentum y Adam conceptual, implementar SGD simple
2.4Funciones de costo MSE y cross-entropy: derivación e implementación2hDerivar e implementar MSE y cross-entropy desde cero, conectar con la función de pérdida de regresión y clasificación
2.5Optimización: funciones convexas/cóncavas y mínimos globales2hIdentificar funciones convexas y cóncavas, entender condiciones de optimalidad, visualizar superficies de error con Plotly

Módulo 3: Estadística Inferencial para Data Scientists (10h)

#TemaHorasAprenderás
3.1Estadística descriptiva avanzada: asimetría, curtosis y outliers2hCalcular asimetría y curtosis, detectar outliers con IQR y z-score, interpretar boxplots y distribuciones empresariales
3.2Intervalos de confianza al 90/95/99% para métricas de negocio2hCalcular intervalos de confianza con SciPy y bootstrap, aplicar a decisiones gerenciales sobre diferencia de medias
3.3Pruebas de hipótesis completas: t-test, ANOVA y chi-cuadrado2hEjecutar t-test de una y dos muestras, ANOVA de una vía, chi-cuadrado de independencia; verificar supuestos con Shapiro-Wilk
3.4Potencia estadística, tamaño de efecto y correlaciones2hCalcular potencia con Cohen's d, interpretar correlaciones Pearson y Spearman, evitar el error de interpretación del p-valor
3.5Regresión lineal simple y múltiple como herramienta analítica2hAjustar regresión lineal con Statsmodels, interpretar coeficientes, diagnósticos de residuos y comunicar a audiencias no técnicas

Módulo 4: Bases de datos + Excel avanzado + Power BI (10h)

#TemaHorasAprenderás
4.1SQL intermedio: JOINs múltiples, subconsultas y funciones de ventana2hDominar INNER/LEFT/RIGHT JOIN, subconsultas correlacionadas, ROW_NUMBER, RANK, LAG/LEAD para análisis temporal
4.2CTEs y PostgreSQL con DBeaver: consultas legibles y optimización2hEscribir CTEs para simplificar consultas complejas, optimizar con índices en PostgreSQL, gestionar con DBeaver
4.3Excel avanzado + Power Query para ETL de múltiples fuentes2hDominar tablas dinámicas avanzadas, INDEX-MATCH, SUMIFS, Power Query para conectar y transformar múltiples fuentes
4.4Power BI: modelo estrella, medidas DAX y dashboards interactivos2hConstruir modelo de datos estrella, escribir medidas DAX (CALCULATE, FILTER, ALL, RANKX, DATESINPERIOD), crear dashboards
4.5Power BI Service: publicación, permisos y actualización programada2hPublicar dashboards en Power BI Service, configurar permisos por rol, programar actualizaciones automáticas

Módulo 5: Proyecto 1 y 2 — Pipelines Ecuador (10h)

#TemaHorasAprenderás
5.1Pipeline 1: API del BCE → Pandas → gradiente descendente → Power BI2hConsumir API pública del BCE, limpiar indicadores macroeconómicos, proyectar tendencias con gradiente descendente
5.2Dashboard macroeconómico con 8+ KPIs y modelo estrella2hConstruir modelo estrella en Power BI, escribir medidas DAX complejas, publicar dashboard con análisis YoY del BCE
5.3Pipeline 2: datos públicos del SRI → estadística inferencial → PostgreSQL2hDescargar y limpiar datos de recaudación tributaria del SRI, ejecutar ANOVA entre regiones, poblar PostgreSQL
5.4Análisis tributario: hipótesis sobre diferencias regionales con p-valor2hFormular y probar hipótesis sobre diferencias de recaudación entre provincias y sectores económicos ecuatorianos
5.5Dashboard Power BI SRI: drill-down por provincia y funciones de ventana2hConstruir dashboard con drill-down por provincia/cantón/sector, medidas DAX con funciones de tiempo

Módulo 6: Proyecto 3 — Pipeline agrícola + portafolio GitHub (10h)

#TemaHorasAprenderás
6.1ETL completo: datos del MAGAP y BanEcuador2hExtraer y limpiar datos públicos de producción agrícola y crédito rural con Pandas; análisis exploratorio
6.2ANOVA por cultivo y región: análisis estadístico riguroso2hEjecutar ANOVA de una vía sobre rendimientos por cultivo y región, verificar supuestos y documentar con p-valor < 0.05
6.3Regresión lineal múltiple para proyección de rendimientos (R² > 0.72)2hAjustar regresión múltiple, calcular R² > 0.72, diagnosticar residuos y comunicar resultados a audiencia agroindustrial
6.4Dashboard ejecutivo Power BI con 6+ visualizaciones interactivas2hConstruir dashboard ejecutivo con mapas, gráficos combinados y segmentadores para análisis de la cadena agrícola
6.5Portafolio GitHub: integración de 3 pipelines con README profesional2hOrganizar los 3 pipelines como portafolio coherente en GitHub, preparar presentación ejecutiva para LinkedIn

Proyectos prácticos (5 proyectos avanzados con caso real Ecuador)

Proyecto 1 — Pipeline macroeconómico: API del Banco Central del Ecuador

Sector: Sector financiero Ecuador (BCE — inflación, tasas de interés, balanza comercial, remesas 2015–2024)

Dataset: API pública del BCE (indicadores macroeconómicos mensuales verificables en línea)

Caso real: Sistema de monitoreo de indicadores macroeconómicos con proyección de tendencias

Arquitectura: Python + Requests + Pandas + gradiente descendente + PostgreSQL + Power BI

Métricas de éxito: Pipeline reproducible en 1 clic, RMSE proyección < 0.15, 8+ KPIs en Power BI

Proyecto 2 — Análisis de cartera tributaria del SRI

Sector: Sector público Ecuador — Servicio de Rentas Internas (SRI)

Dataset: Datos públicos SRI (recaudación por tipo de impuesto, sector, provincia y cantón; series 2018–2024)

Caso real: Análisis estadístico que identifica diferencias significativas de recaudación entre regiones y sectores

Arquitectura: Python + Pandas + SciPy/Pingouin (ANOVA entre regiones) + PostgreSQL + Power BI (drill-down por provincia)

Métricas de éxito: Hipótesis con p-valor documentado, dashboard con drill-down por provincia/cantón/sector

Proyecto 3 — Sistema de análisis de producción agrícola

Sector: Agroindustria Ecuador (cacao, banano, maíz, arroz — sectores exportadores clave; cacao USD 756M en 2024)

Dataset: MAGAP (rendimiento/ha, tipo de cultivo, zona, temporada), BanEcuador (crédito agropecuario por provincia)

Caso real: Herramienta que identifica qué cultivos, zonas y temporadas tienen mayor rendimiento

Arquitectura: Pipeline Python completo, ANOVA por cultivo y región, regresión lineal múltiple, PostgreSQL, Power BI

Métricas de éxito: R² > 0.72 en regresión, ANOVA con p < 0.05, dashboard con 6+ visualizaciones interactivas

Proyecto 4 — Exploración estadística de datos de salud pública INEC

Sector: Salud pública Ecuador (INEC, MSP, Solca)

Dataset: Datos abiertos del INEC (estadísticas vitales, egresos hospitalarios, causas de muerte por provincia)

Caso real: Análisis de distribución de enfermedades crónicas por región para apoyar planificación del MSP

Arquitectura: Python + Pandas + SciPy (chi-cuadrado de independencia entre región y tipo de enfermedad) + Power BI

Métricas de éxito: Análisis estadístico documentado con interpretación para audiencia médica, 5+ visualizaciones con filtros

Proyecto 5 — Dashboard ejecutivo de exportaciones Ecuador

Sector: Comercio exterior Ecuador (ProEcuador, Ministerio de Producción)

Dataset: BCE/ProEcuador (exportaciones por producto, destino y mes 2019–2024) — cacao, banano, camarón, flores

Caso real: Sistema de inteligencia comercial para monitorear el desempeño exportador ecuatoriano

Arquitectura: Python + Pandas + Power BI con modelo estrella, medidas DAX con DATESINPERIOD, publicación en Power BI Service

Métricas de éxito: Modelo estrella correctamente implementado, 4+ medidas DAX avanzadas, análisis de tendencias 5 años


Herramientas (10–15 enterprise-grade 2026)

Python 3.11+, Pandas, NumPy, Requests, SymPy, Matplotlib, Seaborn, Plotly, SciPy, Pingouin, Statsmodels, VS Code, Jupyter Notebook, Google Colab, GitHub (portafolio público), PostgreSQL, MySQL, DBeaver, Excel (avanzado + Power Query), Power BI Desktop, Power BI Service, DAX (CALCULATE, FILTER, ALL, DATESINPERIOD, RANKX)


Metodología

  • **Pipeline-first:** cada módulo construye una etapa del pipeline end-to-end; al final el participante tiene 3 pipelines publicados
  • **Casos Ecuador-first:** datos 100% de fuentes públicas verificables (BCE, SRI, MAGAP, INEC, ProEcuador)
  • **Peer review:** cada proyecto revisado por 2 compañeros con rúbrica de código, visualizaciones y documentación
  • **Presentación ejecutiva obligatoria:** el Proyecto 3 se presenta en formato de reunión gerencial
  • **GitHub-first:** commits semánticos desde el Módulo 1

Distribución de evaluación

ComponentePeso
Proyecto 1: Pipeline macroeconómico API BCE (Python + gradiente descendente + Power BI)17%
Proyecto 2: Análisis tributario SRI (estadística inferencial + SQL + Power BI DAX)18%
Proyecto 3: Pipeline agrícola MAGAP (ANOVA + regresión + Power BI ejecutivo)20%
Proyecto 4: Salud pública INEC (chi-cuadrado + visualización Power BI)15%
Proyecto 5: Dashboard exportaciones BCE/ProEcuador (modelo estrella + DAX avanzado)20%
Participación activa, peer review y calidad de GitHub10%
**TOTAL****100%**

Calificación mínima de aprobación: 70/100. Asistencia mínima requerida: 70% (42 horas de 60).


Salida laboral Ecuador 2026 (roles SENIOR)

RolEmpresa/SectorRango salarial referencial
Analista de datos junior-seniorSRI, BCE, INEC, Ministerio de Economía$1,000–$1,700/mes
Científico de datosBanco Pichincha, Banco del Pacífico, Produbanco$1,300–$2,200/mes
Analista de BICorporación Favorita (Supermaxi), CNT, Claro$1,100–$1,800/mes
Data AnalystMovistar Ecuador, Telefónica, startups tech$1,200–$2,000/mes
Consultor de datos independienteEmpresas PYME y sector agropecuario$800–$2,500/proyecto

Fuente referencial: Glassdoor Ecuador 2025 (promedio Data Scientist $1,842/año; analistas senior con Power BI y SQL avanzado se ubican en cuartil superior), multitrabajos.com, LinkedIn Ecuador.


Certificado MDT

Certificado de aprobación — "Ciencia de Datos: Proyectos Reales Estándar (60h)" emitido por ITSEIA ACADEMY S.A.S. bajo registro del Ministerio de Trabajo del Ecuador (MDT). Válido para hoja de vida, concursos de méritos en sector público (SENRES/MRL), procesos de contratación privada y reconocimiento de competencias en SETEC.

Fuentes verificables

  • BCE Ecuador: API pública de indicadores — www.bce.fin.ec
  • SRI Ecuador: recaudación tributaria pública — www.sri.gob.ec
  • MAGAP: rendimientos agrícolas — www.agricultura.gob.ec
  • ProEcuador: exportaciones — www.proecuador.gob.ec (cacao USD 756M, 2024)
  • INEC: estadísticas demográficas — www.ecuadorencifras.gob.ec
  • Power BI Microsoft: documentación DAX — learn.microsoft.com/power-bi
  • Glassdoor Ecuador 2025: rangos salariales — www.glassdoor.com

*Operador: ITSEIA ACADEMY S.A.S. — RUC 1793233739001*

*Coordinador pedagógico: Héctor Bolívar Velasco Álvarez*

*Modalidad virtual · Precio: $197 · 60 horas · Máximo 25 participantes · Área MDT: 06 — Informática y Comunicación*

Ciencia de Datos: Proyectos Reales — Completo (80h · $297)

Operador: ITSEIA ACADEMY S.A.S. (RUC 1793233739001)

Coordinador: Héctor Bolívar Velasco Álvarez

Modalidad: Virtual · Área MDT: 06

Estructura: 8 módulos × 5 temas × 2h = 80h


Para quién es (perfiles SENIOR)

Profesionales con visión clara de posicionarse como Data Scientists senior o líderes de analítica en Ecuador. Para quienes quieren dominar el stack completo — Python avanzado, estadística inferencial rigurosa, Power BI con DAX completo, bases de datos avanzadas y primeros pasos en MLOps con AWS SageMaker y Google Vertex AI — construir un portafolio de 5 proyectos de calidad enterprise y recibir mentoría directa de Héctor Velasco.

Perfiles típicos:

  • Analistas de datos que quieren el salto a Data Scientist senior ($1,800–$3,500/mes en Ecuador)
  • Profesionales de BI que quieren añadir Python y estadística avanzada a su perfil
  • Gerentes de analítica que necesitan dominar la parte técnica para liderar equipos
  • Consultores independientes que quieren un portafolio sólido y un caso real

Objetivo general

Dominar el ciclo completo de la ciencia de datos — Python avanzado, matemáticas que fundamentan el ML, estadística inferencial rigurosa, BI con DAX avanzado, bases de datos con SQL complejo y fundamentos de MLOps — construyendo 5 proyectos reales con datos ecuatorianos, resolviendo un caso real de cliente ITSEIA, preparándose para certificación en la nube y recibiendo mentoría 1:1 de Héctor Velasco.


Módulos y temas

Módulo 1: Python avanzado para ciencia de datos (10h)

#TemaHorasAprenderás
1.1Programación funcional completa: generators, itertools y functools2hDominar generators, itertools.chain/groupby/islice y functools.reduce/partial para procesamiento eficiente de grandes datasets
1.2Pandas avanzado completo: merge, groupby, melt, explode y apply2hAplicar todos los tipos de join con indicadores, agg múltiple en groupby, melt/explode para datos anidados, apply con funciones complejas
1.3APIs REST y GraphQL: OAuth 2.0, paginación y httpx2hConsumir APIs con autenticación OAuth 2.0 y API keys, manejar paginación avanzada con httpx y reintentos automáticos
1.4Formatos avanzados: Parquet, Feather, Poetry y Black2hLeer y escribir Parquet y Feather para pipelines de producción, gestionar dependencias con Poetry, formatear con Black
1.5NumPy avanzado: broadcasting, fancy indexing y einsum2hAplicar broadcasting para operaciones vectorizadas eficientes, fancy indexing para selección condicional, einsum para contracciones

Módulo 2: Matemáticas para Machine Learning (profundo) (10h)

#TemaHorasAprenderás
2.1Cálculo diferencial completo: derivadas parciales y series de Taylor2hCalcular gradientes multivariables con SymPy, entender series de Taylor y su uso en aproximaciones numéricas para ML
2.2Gradiente descendente completo: batch, mini-batch, momentum y Adam2hImplementar gradiente descendente en 3 variantes, añadir momentum, entender Adam conceptual y learning rate scheduling
2.3Cálculo integral y área bajo la curva como probabilidad2hCalcular integrales definidas con SciPy, interpretar el área bajo la curva de distribuciones como probabilidad acumulada
2.4Optimización: funciones convexas, KKT conceptual y puntos críticos2hIdentificar funciones convexas/cóncavas, entender condiciones KKT conceptualmente, analizar puntos críticos de funciones de costo
2.5Visualización 3D de superficies de costo y curvas de convergencia2hCrear visualizaciones 3D interactivas de superficies de error con Plotly, comparar curvas de convergencia de distintos optimizadores

Módulo 3: Estadística Inferencial rigurosa para Data Science (10h)

#TemaHorasAprenderás
3.1Estadística descriptiva avanzada: distribuciones, kurtosis excess y Grubbs2hCalcular kurtosis excess, detectar outliers con test de Grubbs y IQR, trabajar con distribuciones Weibull y exponencial
3.2Muestreo: estratificado, por conglomerados e intervalos bootstrap2hDiseñar muestras estratificadas y por conglomerados, calcular intervalos de confianza al 90/95/99% con bootstrap
3.3Pruebas de hipótesis completas: Wilcoxon, Shapiro-Wilk y Levene2hDominar pruebas paramétricas y no paramétricas, verificar supuestos de normalidad y homocedasticidad antes de ejecutar
3.4Potencia estadística, eta² y validación cruzada estadística2hCalcular potencia estadística con Cohen's d y eta², aplicar validación cruzada k-fold con análisis estadístico de métricas
3.5Regresión logística explicativa con diagnósticos de residuos2hAjustar regresión logística con Statsmodels, interpretar odds ratios, diagnosticar con matriz de confusión y curva ROC

Módulo 4: SQL avanzado + Power BI completo (10h)

#TemaHorasAprenderás
4.1SQL avanzado: funciones de ventana completas y CTEs recursivas2hDominar ROW_NUMBER, RANK, DENSE_RANK, PERCENT_RANK, LAG/LEAD, FIRST_VALUE/LAST_VALUE, NTILE y CTEs recursivas
4.2PostgreSQL avanzado: particionamiento, JSONB y optimización2hParticionar tablas por fecha, almacenar datos semiestructurados con JSONB, analizar planes de ejecución con EXPLAIN ANALYZE
4.3Power BI: modelo estrella, relaciones y tabla de calendario2hConstruir modelo de datos complejo con dimensiones y hechos, crear tabla de calendario en DAX para análisis de tiempo
4.4DAX avanzado completo: CALCULATE, ALL, USERELATIONSHIP y análisis temporal2hDominar CALCULATE con múltiples filtros, ALL/ALLEXCEPT/ALLSELECTED, DATESINPERIOD, DATEADD, SAMEPERIODLASTYEAR, TOTALYTD/QTD/MTD
4.5Power BI Service: RLS, drill-through, bookmarks y API básica2hConfigurar Row-Level Security por región, crear drill-through y bookmarks, usar la API de Power BI para automatización

Módulo 5: Proyecto 1 — Inteligencia tributaria SRI (10h)

#TemaHorasAprenderás
5.1ETL completo: datos públicos SRI + API BCE con Python2hDescargar y combinar datos de recaudación tributaria del SRI con indicadores del BCE para análisis integrado
5.2Modelo estrella en PostgreSQL: dimensiones tiempo, geografía y sector2hDiseñar el modelo estrella, crear las tablas de dimensión y hecho, poblar con el pipeline Python de ETL
5.3SQL con funciones de ventana para análisis LAG/LEAD de tendencias2hCalcular tendencias de recaudación con LAG/LEAD, identificar sectores con crecimiento anómalo con PERCENT_RANK
5.4Power BI con RLS por región y 10+ KPIs tributarios2hConstruir dashboard con RLS configurado por región, 10+ KPIs interactivos y medidas DAX de análisis temporal
5.5MLflow tracking del modelo de proyección de recaudación2hRegistrar experimento de proyección en MLflow 2.x, comparar versiones del modelo, documentar MAPE < 8%

Módulo 6: Proyecto 2 — Análisis de rendimiento agrícola: cacao y banano (10h)

#TemaHorasAprenderás
6.1ETL con MAGAP y ProEcuador: rendimientos y precios internacionales2hExtraer y limpiar datos del MAGAP (rendimiento/ha, zona, temporada 2015–2024) y ProEcuador (exportaciones y precios)
6.2ANOVA de dos vías: zona × temporada con potencia estadística2hEjecutar ANOVA de dos vías con Pingouin, verificar supuestos, calcular potencia estadística y tamaño de efecto eta²
6.3Regresión múltiple con diagnósticos: R² > 0.78 y homocedasticidad2hAjustar regresión múltiple, calcular R² > 0.78, analizar residuos, detectar heterocedasticidad con test de Breusch-Pagan
6.4PostgreSQL con particionamiento por año y análisis de precio2hParticionar tabla de exportaciones por año, calcular correlación entre precipitación y rendimiento con SQL avanzado
6.5Power BI ejecutivo: análisis YoY y forecast a 12 meses2hConstruir dashboard con SAMEPERIODLASTYEAR, DATEADD y análisis de forecast básico para presentación a audiencia no técnica

Módulo 7: Proyectos 3 y 4 — Dashboard exportaciones + análisis churn (10h)

#TemaHorasAprenderás
7.1Modelo estrella exportaciones: 5 dimensiones en PostgreSQL2hDiseñar modelo estrella con dimensiones producto, país destino, mes, región y tipo de exportación; poblar con BCE/ProEcuador
7.2DAX complejo: YoY, MTD, QTD y forecasting con LINEST2hImplementar 6+ medidas DAX avanzadas, análisis Year-over-Year, Month-to-Date y forecasting básico con LINEST en Power BI
7.3Análisis de churn: EDA profundo + chi-cuadrado en telecomunicaciones2hAplicar EDA sobre dataset Telco Ecuador, ejecutar chi-cuadrado de independencia entre variables categóricas y churn
7.4Regresión logística explicativa + t-test de cargos mensuales2hAjustar regresión logística explicativa con Statsmodels, t-test para diferencia de cargos entre churners y no churners
7.5Power BI de segmentación de clientes en riesgo + automatización2hConstruir dashboard de segmentación de clientes por riesgo de churn, automatizar reporte con Python + Openpyxl

Módulo 8: MLOps + mentoría Héctor + caso real cliente + certificación (10h)

#TemaHorasAprenderás
8.1MLflow 2.x: tracking completo, registro de modelos y Evidently AI2hDominar MLflow para tracking y versionado de modelos, usar Evidently AI básico para detectar drift de datos en producción
8.2AWS SageMaker: notebooks, training jobs y endpoints de inferencia2hConfigurar SageMaker Notebook Instance, ejecutar training job básico, desplegar endpoint de inferencia para un modelo sklearn
8.3Google Vertex AI + Azure ML Studio: AutoML y Designer2hUsar Vertex AI AutoML para datasets tabulares, Azure ML Designer para pipelines visuales; comparar costos y casos de uso
8.4Caso real cliente ITSEIA: resolución supervisada por Héctor2hResolver problema de datos de empresa ecuatoriana real con pipeline completo (ETL + estadística + Power BI + presentación ejecutiva)
8.5Mentoría 1:1 Héctor + plan carrera + hoja de ruta certificación nube2hRevisión personalizada del portafolio GitHub, estrategia LinkedIn Ecuador, plan de carrera a 12 meses hacia Data Scientist senior

Proyectos prácticos (5 proyectos avanzados con caso real Ecuador)

Proyecto 1 — Sistema de inteligencia tributaria Ecuador

Sector: Sector público — SRI (Servicio de Rentas Internas Ecuador)

Dataset: Datos públicos SRI (recaudación 2018–2024) + API del BCE (inflación, PIB per cápita por provincia)

Caso real: Dashboard de inteligencia tributaria para identificar brechas de recaudación entre provincias

Arquitectura enterprise: ETL Python + PostgreSQL (modelo estrella) + SQL (ventanas LAG/LEAD) + Power BI (RLS) + MLflow tracking

Métricas de éxito: ANOVA con p < 0.05, modelo de proyección con MAPE < 8%, dashboard con RLS y 10+ KPIs

Proyecto 2 — Análisis de rendimiento agrícola: cacao y banano

Sector: Agroindustria exportadora Ecuador (Ecuador exportó USD 756M en cacao en 2024; mayor exportador mundial de cacao fino de aroma)

Dataset: MAGAP (rendimiento/ha, zona, temporada 2015–2024), ProEcuador (exportaciones y precio internacional)

Caso real: Análisis estadístico que identifica qué factores determinan el rendimiento del cacao y su correlación con exportaciones

Arquitectura enterprise: Pipeline Python completo, ANOVA de dos vías, regresión múltiple con diagnósticos, PostgreSQL particionado, Power BI

Métricas de éxito: R² > 0.78, ANOVA con potencia estadística calculada, dashboard con forecast a 12 meses

Proyecto 3 — Dashboard de exportaciones con análisis de tiempo avanzado

Sector: Comercio exterior Ecuador (ProEcuador, Ministerio de Producción; exportadoras de cacao, banano, camarón, flores)

Dataset: BCE/ProEcuador (exportaciones por producto, destino y mes 2015–2024)

Caso real: Sistema de inteligencia comercial para monitorear desempeño exportador y detectar oportunidades

Arquitectura enterprise: PostgreSQL con modelo estrella (5 dimensiones), CTEs y ventanas, Power BI Service con DAX complejo

Métricas de éxito: Modelo estrella con 5 dimensiones, 6+ medidas DAX avanzadas, 2 insights accionables documentados

Proyecto 4 — Análisis de churn en telecomunicaciones Ecuador

Sector: Telecomunicaciones Ecuador (CNT — 4.5M clientes; Movistar; Claro)

Dataset: Telco Customer Churn adaptado con variables, ciudades y precios ecuatorianos locales

Caso real: Análisis estadístico de factores que predicen la baja de clientes con segmentación por plan y región

Arquitectura enterprise: Python + Pandas (EDA) + SciPy/Pingouin + Statsmodels (regresión logística) + Power BI + Openpyxl

Métricas de éxito: Supuestos verificados y documentados, AUC-ROC > 0.80, dashboard de segmentación por riesgo de churn

Proyecto 5 — Caso real cliente ITSEIA (consultoría supervisada senior)

Sector: A definir según perfil (retail, banca, agroindustria, telecomunicaciones, sector público)

Dataset: Datos reales del cliente o datos públicos del sector seleccionado

Caso real: Problema de negocio real con impacto demostrable — desde levantamiento hasta dashboard y presentación ejecutiva

Arquitectura: Python + SQL + Power BI + MLflow si aplica; definida según el problema

Métricas de éxito: Aprobación de Héctor Velasco, pipeline documentado, insights con cuantificación del impacto económico


Herramientas (10–15 enterprise-grade 2026)

Python 3.11+, Pandas, NumPy, Requests, httpx, SymPy, Matplotlib, Seaborn, Plotly, SciPy, Pingouin, Statsmodels, Openpyxl, Poetry, Black, flake8, MLflow 2.x, Evidently AI (básico), AWS SageMaker (introducción), Google Vertex AI (introducción), Azure ML Studio (introducción), Docker (básico), VS Code, Jupyter Notebook, GitHub (portafolio público), PostgreSQL, DBeaver, Excel (avanzado + Power Query), Power BI Desktop, Power BI Service, DAX completo


Metodología

  • **Pipeline end-to-end desde el Módulo 1:** cada sesión avanza una etapa del pipeline completo
  • **Casos Ecuador-first:** datos 100% de fuentes públicas ecuatorianas verificables o adaptaciones del contexto latinoamericano
  • **Peer review estructurado:** rúbrica de 5 dimensiones (código, estadística, visualización, documentación, reproducibilidad)
  • **Presentación ejecutiva obligatoria:** los proyectos 2 y 5 se presentan en formato de reunión gerencial
  • **MLOps desde el Módulo 5:** tracking con MLflow 2.x antes del caso real

Distribución de evaluación

ComponentePeso
Proyecto 1: Inteligencia tributaria SRI (ETL + SQL + Power BI con RLS + MLflow)18%
Proyecto 2: Análisis cacao/banano (ANOVA 2 vías + regresión múltiple + Power BI ejecutivo)20%
Proyecto 3: Dashboard exportaciones (modelo estrella + DAX avanzado + Power BI Service)17%
Proyecto 4: Churn telecomunicaciones (estadística completa + regresión logística + Power BI)15%
Proyecto 5: Caso real cliente ITSEIA (evaluado por Héctor Velasco)20%
Participación activa, peer review y calidad de GitHub10%
**TOTAL****100%**

Calificación mínima de aprobación: 70/100. Asistencia mínima requerida: 70% (56 horas de 80).


Salida laboral Ecuador 2026 (roles SENIOR)

RolEmpresa/SectorRango salarial referencial
Data Scientist seniorBanco Pichincha, Produbanco, Banco del Pacífico$1,800–$3,500/mes
Analista de BI seniorSRI, BCE, Ministerio de Economía$1,500–$2,500/mes
Gerente de analítica de datosCorporación Favorita, CNT, Movistar$2,200–$4,000/mes
Consultor de datos independienteExportadoras, sector agropecuario, PYME$1,500–$5,000/proyecto
Data Engineer juniorStartups tech Quito y Guayaquil$1,800–$2,800/mes

Fuente referencial: Glassdoor Ecuador 2025 (promedio Data Scientist $1,842/año; perfiles senior con Power BI DAX avanzado + Python + MLOps básico se ubican en percentil 75–90 del rango salarial), multitrabajos.com, LinkedIn Ecuador.


Certificado MDT

Certificado de aprobación — "Ciencia de Datos: Proyectos Reales Completo (80h)" emitido por ITSEIA ACADEMY S.A.S. bajo registro del Ministerio de Trabajo del Ecuador (MDT). El nivel Completo incluye carta de recomendación firmada por Héctor Velasco para procesos de selección laboral, propuestas de consultoría o postulaciones a becas de formación avanzada.

Fuentes verificables

  • BCE Ecuador: API pública de indicadores — www.bce.fin.ec
  • SRI Ecuador: recaudación tributaria pública — www.sri.gob.ec
  • MAGAP: rendimientos agrícolas — www.agricultura.gob.ec
  • ProEcuador: exportaciones cacao USD 756M (2024) — www.proecuador.gob.ec
  • CNT Ecuador: estadísticas de usuarios — www.cnt.gob.ec
  • MLflow: documentación oficial 2.x — mlflow.org
  • AWS SageMaker — docs.aws.amazon.com/sagemaker
  • Google Vertex AI — cloud.google.com/vertex-ai
  • Glassdoor Ecuador 2025: rangos salariales — www.glassdoor.com

*Operador: ITSEIA ACADEMY S.A.S. — RUC 1793233739001*

*Coordinador pedagógico: Héctor Bolívar Velasco Álvarez*

*Modalidad virtual · Precio: $297 · 80 horas · Máximo 25 participantes · Área MDT: 06 — Informática y Comunicación*