Del curso: Python en Excel para análisis de datos
Accede al curso completo hoy mismo
Únete hoy para acceder a más de 24.000 cursos impartidos por expertos del sector.
Describir columnas de texto y obtener sus estadísticas
Del curso: Python en Excel para análisis de datos
Describir columnas de texto y obtener sus estadísticas
En la etapa de exploración de datos, además de analizar las estadísticas de las columnas numéricas, es interesante obtener información sobre las columnas descriptivas, que suelen ser columnas de texto. Veamos cómo hacerlo. Activo la celda en modo Python, elijo el Data Frame y voy a utilizar un nombre de columna Esta columna es de tipo texto y luego el método describe que es el mismo que para las estadísticas numéricas. Ejecuto y obtengo una serie. En esta serie tengo los valores. Me devuelve el conteo de elementos, la cantidad de valores únicos, el estado de la columna, que tiene mayor frecuencia, en este caso, es el valor Bachiller, y la cantidad de apariciones de ese estado, que son cinco. Se puede explorar también desde un Data Frame que haya sido creado en una variable. Funciona exactamente igual. Es posible cerrar el nombre de la columna entre corchetes y ponerle comillas, aunque si el campo no tiene espacios o caracteres especiales se admite directamente como lo he escrito yo…
Practica mientras aprendes con los archivos de ejercicios.
Descarga los archivos que el instructor utiliza para enseñar el curso. Sigue las instrucciones y aprende viendo, escuchando y practicando.
Contenido
-
-
-
-
-
(Bloqueado)
Obtener información sobre la estructura del dataframe2 min 7 s
-
(Bloqueado)
La función head para descubrir el contenido de una muestra de datos1 min 34 s
-
(Bloqueado)
Obtener datos desde la proyección de una o más columnas2 min 9 s
-
(Bloqueado)
Obtener información sobre tipos de datos1 min 41 s
-
(Bloqueado)
Descubrir la estadística de los datos con la función describe1 min 53 s
-
(Bloqueado)
Describir columnas de texto y obtener sus estadísticas1 min 55 s
-
Identificar valores nulos2 min 15 s
-
(Bloqueado)
Trabajar con valores únicos u duplicados1 min 38 s
-
(Bloqueado)
Comprobar el orden de definición y referencia para evaluar los objetos1 min 50 s
-
(Bloqueado)
-
-
-