- Aprender procedimientos básicos de manejo de datos en R.
- Seleccionar
- Filtrar
- Agrupar
Contar
Explorar las variables categóricas de la base de datos de marginación
21 de agosto de 2018
Contar
Explorar las variables categóricas de la base de datos de marginación
dplyr
dplyr
El manejo de datos con dplyr
se basa en 5 verbos principales.
Función | Acción | Uso |
---|---|---|
select() |
Seleccionar columnas | select(ENT, MUN, AÑO) |
filter() |
Filtrar por filas de acuerdo a una condición | filter(AÑO == "2015") |
mutate() |
Modificiar una variable con una función | mutate(ANO = as.numeric(AÑO)) |
summarise() |
Crear sumarios | summarise(años = unique(AÑO)) |
count() |
Cuenta categorías | count() |
arrange() |
Ordena los resultados | arrange(-AÑO) |
A esos verbos se suman un adverbio
group_by
%>%
datos %>% funcion1 %>% funcion2
Tatuaje mental:
Ctrl+Shift+M
Ctrl+Shift+M
Ctrl+Shift+M
Ctrl+Shift+M
Ctrl+Shift+M
Ctrl+Shift+M
Ctrl+Shift+M
Ctrl+Shift+M
library(tidyverse) marginacion %>% select(AÑO, ENT, POB_TOT, GM) %>% #Solo las col que de interés filter(AÑO == "2015") %>% #Solo 2015 filter(GM == "Muy alto") %>% #Solo "Muy Alto" group_by(ENT) %>% #Agrupo por Entidad filter(POB_TOT > 50000) %>% #Solo municipio con más de 5k count() %>% #Cuento. Hereda los grupos! arrange(-n) -> resultado #Asigno nombre
resultado #Visualizo el resultado
## # A tibble: 5 x 2 ## # Groups: ENT [5] ## ENT n ## <chr> <int> ## 1 Chiapas 6 ## 2 Guerrero 2 ## 3 Chihuahua 1 ## 4 Puebla 1 ## 5 Veracruz de Ignacio de la Llave 1
Ctrl+Shift+M
Ctrl+Shift+M
Ctrl+Shift+M
Ctrl+Shift+M
dplyr()
Estos son menos importantes, pero ayudan en casos especiales.
Función | Acción | Uso |
---|---|---|
distinct() |
Valores únicos en una columna | distinct(ENT) |
drop_na() |
Elimina missing | drop_na() |
replace_na() |
Imputa valores a los NA |
replace_na(list(SPRIM = 0)) |
na_if() |
Imputa NA a ciertos valores | na_if(-9999) |
sample_n() |
Extrae una muestra aleatoria tamaño n | sample_n(50) |
ENT | MUN | GM |
---|---|---|
Aguascalientes | Aguascalientes | Muy bajo |
Aguascalientes | Jesús María | Muy bajo |
Aguascalientes | Calvillo | Bajo |
Aguascalientes | Rincón de Romos | Bajo |