Del curso: Python en Excel para análisis de datos

Identificar valores nulos

En labores de análisis de datos, es importante obtener información del contenido de las columnas, no solo de los valores como tal, sino de la existencia de valores nulos o desconocidos. Veamos algunos ejemplos. El método isnull aplicado al dataframe devuelve un dataframe relleno con VERDADERO o FALSO para cada elemento del objeto que lo llama. El estado VERDADERO se corresponde con un valor nulo. Otra vía puede ser utilizar el método isna, que nos devuelve el mismo resultado. Si multiplicamos el resultado por 1, obtenemos también un dataframe, pero en este caso relleno con números 0 o 1, donde el 1 se corresponde con el valor nulo. Es posible, además, analizar una columna en particular. En este caso, se trata de la columna Nombre y devuelve una serie con VERDADERO en aquellas filas donde el valor es nulo. Esta expresión se puede aprovechar en un método query y tendríamos como resultado las dos filas donde hay valores nulos en la columna Nombre. En este caso, tendríamos todas las columnas. Se puede, además, preguntar por todas las columnas al mismo tiempo y como resultado tenemos una serie que nos indica VERDADERO o FALSO siempre que haya algún valor nulo. Nombre devuelve VERDADERO, Nacimiento e Hijos. Y, para completar, podemos conocer la cantidad de valores nulos que tenemos en una columna. En la columna Nombre hay 2, en la columna Nacimiento hay 1 y también hay un valor nulo en la columna Hijos. Los valores nulos o desconocidos provocan tareas adicionales de limpieza de datos, por lo que es relevante identificarlos cuanto antes.

Contenido