Del curso: Python en Excel para análisis de datos
Identificar valores nulos
Del curso: Python en Excel para análisis de datos
Identificar valores nulos
En labores de análisis de datos, es importante obtener información del contenido de las columnas, no solo de los valores como tal, sino de la existencia de valores nulos o desconocidos. Veamos algunos ejemplos. El método isnull aplicado al dataframe devuelve un dataframe relleno con VERDADERO o FALSO para cada elemento del objeto que lo llama. El estado VERDADERO se corresponde con un valor nulo. Otra vía puede ser utilizar el método isna, que nos devuelve el mismo resultado. Si multiplicamos el resultado por 1, obtenemos también un dataframe, pero en este caso relleno con números 0 o 1, donde el 1 se corresponde con el valor nulo. Es posible, además, analizar una columna en particular. En este caso, se trata de la columna Nombre y devuelve una serie con VERDADERO en aquellas filas donde el valor es nulo. Esta expresión se puede aprovechar en un método query y tendríamos como resultado las dos filas donde hay valores nulos en la columna Nombre. En este caso, tendríamos todas las columnas. Se puede, además, preguntar por todas las columnas al mismo tiempo y como resultado tenemos una serie que nos indica VERDADERO o FALSO siempre que haya algún valor nulo. Nombre devuelve VERDADERO, Nacimiento e Hijos. Y, para completar, podemos conocer la cantidad de valores nulos que tenemos en una columna. En la columna Nombre hay 2, en la columna Nacimiento hay 1 y también hay un valor nulo en la columna Hijos. Los valores nulos o desconocidos provocan tareas adicionales de limpieza de datos, por lo que es relevante identificarlos cuanto antes.
Practica mientras aprendes con los archivos de ejercicios.
Descarga los archivos que el instructor utiliza para enseñar el curso. Sigue las instrucciones y aprende viendo, escuchando y practicando.
Contenido
-
-
-
-
-
(Bloqueado)
Obtener información sobre la estructura del dataframe2 min 7 s
-
(Bloqueado)
La función head para descubrir el contenido de una muestra de datos1 min 34 s
-
(Bloqueado)
Obtener datos desde la proyección de una o más columnas2 min 9 s
-
(Bloqueado)
Obtener información sobre tipos de datos1 min 41 s
-
(Bloqueado)
Descubrir la estadística de los datos con la función describe1 min 53 s
-
(Bloqueado)
Describir columnas de texto y obtener sus estadísticas1 min 55 s
-
Identificar valores nulos2 min 15 s
-
(Bloqueado)
Trabajar con valores únicos u duplicados1 min 38 s
-
(Bloqueado)
Comprobar el orden de definición y referencia para evaluar los objetos1 min 50 s
-
(Bloqueado)
-
-
-