cerrar
Coloquios Matemáticas Primavera 2024
25 de enero de 2024
De 14.30 a 15.30 h
ITAM, Río Hondo

Ponente: Diego Arturo Velázquez-Trejo

Título: Metodología para análisis y reconstrucción de datos en muestreos biológicos 

Resumen: Uno de los desafíos más críticos en estudios longitudinales radica en el seguimiento exhaustivo de los participantes en estudios longitudinales sobre todo por los sesgos que se dan por pérdidas al seguimiento lo cual puede generar errores sistemáticos diferenciales que afectan los resultados de este tipo de estudios. Utilizando datos derivados de una cohorte retrospectiva de 200 personas que viven con VIH en combinación con una batería de técnicas avanzadas de análisis estadístico y aprendizaje de máquina, implementamos una metodología para reconstruir datos faltantes por pérdidas en el seguimiento en estudios longitudinales.  Específicamente, se desarrolló TeSCO (Temporal Segment Correlation Optimization), una metodología para identificar una partición óptima en el tiempo en donde es más clara la relación entre dos variables cualquiera de interés. Esta selección temporal nos permitió reducir el conjunto de datos a un subconjunto temporalmente optimizado. En la etapa de imputación, utilizamos redes neuronales (Deep Autoencoders) configuradas mediante optimización de hiper-parámetros vía algoritmos genéticos, entrenados sobre un conjunto de datos simulados.  Las arquitecturas de los Deep-Autoencoders resultantes del proceso de optimización probaron tener mejor desempeño en comparación con métodos convencionales como imputación por media, MICE, imputación por Random Forest o imputación por vecinos cercanos (KNN).

 


Organiza: Departamento Académico de Matemáticas
Teléfono(s):
Pablo Catañeda Rivera 5628 4000 ext. 3830
Correo Electrónico:
pablo.castaneda@itam.mx