Next Gen Sci TDA · Gemelos Agrícolas: Distancia-360
highlight_off

Este proyecto ejecuta el cálculo masivo de distancias para todas las parejas de municipios usando la métrica acordada. Se diseñan algoritmos por bloques y/o paralelización para optimizar memoria y tiempo; se exploran estructuras sparse, formatos HDF5 y/o índices de búsqueda aproximada (ANN) para consultas rápidas. Los entregables son: (i) la matriz de distancias persistente (
distancias.h5
) o un índice ANN equivalente, (ii) un grafo k-NN nacional con pesos de similitud, y (iii) scripts reproducibles con perfiles de rendimiento. Se incluyen pruebas de escalabilidad y validaciones de integridad (simetría, no negatividad, diagonales nulas). Impacto: habilitar análisis de proximidad, clustering y recomendación de “análogos” a gran escala, asegurando tiempos de respuesta aptos para tableros interactivos y futuras ampliaciones (nuevas variables o ventanas temporales) sin rehacer todo el pipeline.Calcular distancias desde cada municipio eficiente al universo; construir grafo k-NN y clústeres.
Validar “análogos” con evidencia externa (producción histórica, cercanía climática) y análisis de riesgo.
Entregables: lista priorizada de análogos por municipio eficiente, mapas y dashboard interactivo.
Criterios de éxito: precisión/recuperación frente a casos conocidos, UX clara y tiempos de respuesta ágiles.
36
José Andrés García González
anteus79@tec.mx
data science
data analysis
ML
AI
TDA
warning
error_outline
Experiencia en Investigación
30 %
Experiencia con visualización de datos
30 %
Experiencia con análisis de datos
40 %





:
circle
circle
circle
circle
circle