Plataforma de analítica avanzada Covid-19
¿Cómo lo hicimos?
En conjunto, con nuestro equipo de innovación, ciencia de datos, ingeniería y expertos en economía, desplegamos una solución para obtener información de valor sobre la propagación del coronavirus en Colombia. Plataforma de analítica avanzada Covid-19- fue el resultado de integrar diferentes fuentes oficiales de información; por ejemplo, Instituto Nacional de Salud, Presidencia y DANE; entre otras.
Nuestra plataforma inteligente de análisis multivariado de datos del Covid-19 fue el resultado de la ciencia de datos aplicada; primero, identificamos el problema, para este caso, suficiente información oficial sin ser relacionada, toda circulando de manera aislada; segundo, obtuvimos y limpiamos los datos; finalmente, analizamos, y determinamos patrones para generar índices, gráficas y tableros de fácil interpretación. Como resultado entregamos una herramienta entendible y aportó en la toma de acciones y decisiones.
¿Por qué ciencia de datos en tiempos de pandemia?
Colombia es un país que está en desarrollo y en medio de la emergencia que atravesamos a causa de la pandemia, entramos en una disyuntiva, ¿priorizar la salud o la economía? en efecto, ambas variables son determinantes; no obstante, únicamente el análisis basado en información real pues conducir a decisiones acertadas; de modo que, tener acceso a grandes volúmenes de información no es suficiente; por lo cual, la gran diferencia es agregarle valor a la información aplicando la ciencia de los datos.
“El mundo está cambiando y siendo afectado y en general, la ciencia de datos ayuda a enfrentar cualquier problemática. Puntualmente los datos están salvando vidas; por lo tanto, como sociedad debemos entender cómo el virus está afectando a nuestra región, para adoptar más acciones de prevención basadas en datos reales ”, aseguró Edwin Pardo — Chief product & business development officer Datawifi
¿Qué es la ciencia de los datos?
De acuerdo con Juliana Guerrero — Head of data science Datawifi- “La ciencia de datos, desde una perspectiva técnica, es la combinación de teoría, matemática y estadística; con algoritmos de programación; es el conocimiento del contexto de los datos; es decir, los datos tienen un valor y un conocimiento; así que lo que hacemos como científicos de datos es extraer ese conocimiento. Además, encontramos puntos clave, descubrimos patrones para analizar comportamientos, hacer predicciones, y finalmente, tomar decisiones de manera inteligente, basados en información real”.
¿Qué datos analizamos con nuestra plataforma de analítica avanzada Covid-19?
Plataforma de analítica avanzada Covid-19
Para comenzar, un reporte express en el tablero inicial, con información general; así como, número de casos activos, recuperados, fatales, casos tratados en casa, en UCI o en hospital, datos demográficos y acumulado de cantidad de muestras procesadas de Covid-19 en Colombia.
A su vez, analizamos factores como la movilidad, sobre medios de transporte masivo en las principales ciudades del país; así como, Medellín, Barranquilla, Bucaramanga, Bogotá-Soacha, Cali, Pereira y Cartagena, entre otros. Comparamos la cantidad de pasajeros en un día típico laboral, antes de la pandemia, frente a la cantidad de usuarios que se transportan ahora, en tiempos de pandemia.
Desarrollamos un tablero comparativo por colores; con información de distintas provincias que informaron la cantidad de casos confirmados; de hecho, fusionamos un mapa con la cantidad de casos confirmados y de muertes por Covid- 19 en el mundo; finalmente, integramos un segmento para ilustrar los 20 países con más casos reportados en el mundo.
Analizamos índices emergencia sobre municipios o regiones que requieren toma de acciones rápidas; frente a tres caracteristicas: salud, economía y aspecto social; teniendo en cuenta algunas variables:
- tasas de contagios del Covid-19 relacionadas con recursos y nivel de pobreza en la región o municipio
- valor agregado per capita
- capacidad de atención de camas hospitalarias para prever un posible índice de emergencias
- ingreso per capita
- porcentaje de población
- ocupación formal
- cantidad de empleados formales
- población con necesidades básicas insatisfechas
Creamos un tablero con estadísticas en donde se calculó el R0; el cual indica el número reproductivo efectivo y el número promedio de personas nuevas infectadas, que genera un caso positivo a lo largo de su período infeccioso. Si R0>1 entonces el virus sigue propagándose y cuando R0<1 el virus está dejando de propagarse; así también, completamos el tablero con una gráfica informativa sobre el histórico de esta variable entre fechas; calculamos los días de duplicación del virus y su tasa de letalidad, junto a una gráfica comparativa sobre la cantidad de casos confirmados, respecto a sus muertes.
Incluimos un tablero de evolución comparativa para encontrar similitudes y diferencias sobre la propagación del virus por regiones, de acuerdo con impacto, capacidad regional, equipamiento (capacidad de camas o ambulancias), y aspectos socioeconómicos; tanto es así que se puede entender a través de este tablero cuáles fueron las regiones con mayor o menor riesgo frente a la pandemia.
Así también, integramos otros datos de análisis, como la encuesta de ciencia ciudadana; cuyos resultados procesamos y analizamos en un tablero, que evidenció: porcentaje de personas que cumplian con los decretos de la cuarentena, análisis poblacionales segmentados por estrato, género y edad, gráficos sobre la actividad económica de los encuestados, número de adultos y menores de edad y síntomas psicológicos.
De la misma manera, nuestra plataforma habilitamos un tablero para monitorear las regiones conforme a su población vulnerable; el grupo etario cercano a los 70 años tiene una mayor tendencia a convertirse en un caso fatal; por ejemplo, analizamos que el eje cafetero es la región más envejecida de Colombia porque cuenta más personas en estos rangos de edad.
Nuestra principal motivación fue entregarle a la sociedad una herramienta de apoyo para asuntos de planeación pública, toma de decisiones y acciones gubernamentales en el momento preciso.
En conclusión, integramos información, cruzamos variables y conectamos las fuentes, para darle valor a los datos; como resultado, obtuvimos análisis profundos en temas de geolocalización, mapas de calor, segmentación de personas y sistemas de recomendaciones personalizadas.
Tomamos información de los casos que se reportaron durante 4 meses, día a día; revisamos tasas de contagio frente a número de habitantes y número de contagios relativo al total de la población; es decir, analizamos la expansión del virus con respecto al tamaño poblacional.
Iniciamos con un tablero básico, el cual convertimos en un desarrollo evolutivo, y con el paso del tiempo fuimos agregando otros nuevos; debido a que, la ciencia de datos es un proceso de conocimiento y aprendizaje continuo.
Estuvimos en una búsqueda constante e integramos nuevas fuentes de datos oficiales, que aportaran a la plataforma, siendo reactivos a las novedades que se presentaban con el paso de la pandemia. Logramos demostrar la capacidad de reacción rápida frente a imprevistos; como siempre, encontramos oportunidades y soluciones sobre problemáticas; esto confirma nuestro propósito: Darle valor a los datos.