Certificados Home Historia Portafolio
  • Base de datos cruda.
  • Uso de Python.
  • Heatmaps.
  • Herramientas de Machine Learning.
  • Concatenación de datos.
  • Matrices de confusión.
  • Datos desbalanceados.

Análisis sobre datos iniciales del Covid-19

Proyecto empleando herramientas de aprendizaje automático

Se realizó un análisis sobre los datos del Covid-19 en México, actualizados hasta el 03 de Julio del 2020. Empleando métodos de clasificación, como Random Forest y Regresión logística, se dio solución a los siguientes puntos en caso de contagiarse de dicho virus.

  • Predecir si un paciente con co-morbilidades, en caso de contagiarse de Covid-19, ingresará a la Unidad de Cuidados Intensivos (UCI).
  • Predecir si un paciente con co-morbilidades muere, en caso de contagiarse de Covid-19.

Durante este trabajo se realizó un exhaustivo preprocesamiento de la base de datos, se realizaron métodos undersampling, oversampling, concatenación de datos, identificación de correlación.

Además se usaron métodos de validación cruzada, uso de métricas, matrices de confusión, segmentación de datos y métodos de visualización para evaluar el poder predictivo de los algoritmos.

Análisis topológico de datos aplicado a series de tiempo

Proyecto extracurricular
Colaborador: Luis Ramón Munive Hernández

Se modelaron diferentes series de tiempo, tales como el tipo de cambió diario peso-dólar, desde Julio de 1994 hasta Agosto del 2020, o la cantidad de sismos mensuales en México, desde Enero de 1900 hasta Agosto del 2021, entre otras. Esto con la finalidad de utilizar herramientas topológicas para determinar posibles patrones en las series temporales. Para ello se realizaron modificaciones en los datos y se mostraron los resultados finales mediante diagramas de persistencia.

Durante este trabajo se realizaron análisis a grandes volúmenes de datos, y de bases de datos provenientes de diferentes fuentes. Se presentaron resultados mediante diagramas que facilitaran su interpretación, así como herramientas matemáticas complejas. También se trabajó en equipo, complementando conocimientos en conjunto, se realizaron ponencias (Inglés y Español) y se participó en concursos.

Versión en inglés 
  • Base de datos distribuida.
  • Uso de Python y R.
  • Big data.
  • Trabajo en equipo.
  • Series de tiempo.
  • Diagramas de persistencia.
  • Modelación de datos con herramientas complejas.
  • Ponencia en inglés.
  • Base de datos de tienda de ropa.
  • Análisis de datos general.
  • Identificación de valores atípicos.
  • Tablas dinámicas
  • Segmentación de datos.
  • Identificación de patrones.
  • Datos en escala de tiempo.
  • Dashboard.

Análisis de datos de tienda departamental

Proyecto personal

Se realizó un análisis de una base de datos de una tienda departamental de ropa, con la intención de identificar posibles problemas en las devoluciones de productos.

Durante este trabajo se realizaron análisis de ventas y devoluciones mediante segmentación de datos, tablas dinámicas. Además se identificaron valores atípicos mediante métodos de visualización como series temporales, gráficos de barras, entre otros. Se identificaron los problemas y se elaboró un dashboard dinámico con la intención de mostrar los resultados obtenidos.