
Análisis exploratorio de datos de COVID-19 - Se encuentra un notebook y el informe interactivo
Introducción
El Covid-19 ha sido una de las mayores crisis sanitarias y sociales de nuestra época. Para comprender mejor la magnitud de esta pandemia y tomar decisiones informadas, es fundamental realizar un Análisis Exploratorio de Datos (EDA, por sus siglas en inglés). Exploraremos paso a paso el proceso EDA del Covid-19, utilizando herramientas y técnicas para visualizar, analizar y entender los datos relacionados con la propagación del virus en diferentes países.
1. Importación de librerías y carga del dataset
Comenzamos nuestro proceso EDA importando las librerías necesarias, como pandas, matplotlib, seaborn y numpy. Luego, cargamos el dataset en formato CSV utilizando la función read_csv de la librería pandas. A continuación, realizamos la limpieza de datos, eliminando columnas que no aportan información relevante para nuestro análisis.
2. Filtrado de datos por país
Para realizar un análisis más específico, seleccionamos un país en particular. En nuestro caso, elegimos Chile como ejemplo. Filtramos los datos del dataset según el país seleccionado y creamos un nuevo dataframe para trabajar con él.
3. Análisis y visualización de datos
En esta etapa del proceso, nos sumergimos en el análisis y la visualización de los datos. Utilizando gráficos de líneas, analizamos y visualizamos features como casos nuevos, fallecidos nuevos, positividad, pacientes UCI y vacunados en una línea de tiempo desde el inicio de la pandemia hasta la actualidad. Además, calculamos correlaciones entre variables y creamos un mapa de calor para comprender mejor las relaciones entre los features seleccionados.
4. Exportación del dataset
Una vez finalizada la etapa de limpieza y selección de columnas, exportamos el nuevo dataset para su uso en análisis interactivos con herramientas como Plotly. Esto nos permite generar visualizaciones más interactivas y atractivas para el usuario.
5. Uso de la librería Plotly
Finalmente, utilizamos la librería Plotly para crear visualizaciones interactivas. Mediante el uso de funciones específicas, generamos gráficos de barras comparando diferentes features, como la cantidad de casos entre dos países. También creamos un mapa del mundo que muestra las estadísticas del Covid-19 en diferentes países utilizando un código de colores.
Conclusiones
El Análisis Exploratorio de Datos del Covid-19 es una herramienta poderosa que nos permite comprender mejor la propagación del virus y tomar decisiones informadas. A través de la visualización de datos y el cálculo de correlaciones, podemos identificar patrones, tendencias y relaciones entre diferentes variables. La utilización de librerías como Plotly nos permite crear visualizaciones interactivas que facilitan la comprensión de los datos por parte del usuario.
Aquí el pdf
- Aquí se encuentra un PDF de la pagina, para que puedas leer el informe. Enlace al PDF