ech
ech.Rmd
El paquete ech
es una caja de herramientas para el
procesamiento de la Encuesta
Continua de Hogares de Uruguay realizada por en Instituto Nacional
de Estadística (INE). Pretendiendo contribuir a la comunidad de usuaries
de R en Uruguay, facilitando el uso de una de las encuestas
socioeconómicas más importantes del país. En este sentido, el paquete
implementa una serie de funciones que permiten el cálculo de los
principales indicadores socioeconómicos que permite la encuesta.
Una serie de funciones del paquete que se usan internamente permiten descargar de la página del INE y convertir a un formato tidy los datos de: Índice de Precios al Consumo (IPC con base 2010), el Índice de Precios de Alimentos y Bebidas (IPAB con base 2010), Canasta Básica Alimentaria y No Alimentaria (CBA y CBNA), la codigue de CIIU4, los microdatos de cada ECH y sus respectivos diccionarios para los años 2011 a 2019.
Las funciones para crear variables se organizan según la dimensión a la cual corresponden, así tenemos:
Vivienda (Dwelling): permite calcular la situación estructural y coyuntural de la vivienda, las privaciones de la vivienda, hacinamiento y la tenencia de la vivienda.
Educación (Education): permite calcular el máximo nivel alcanzado, los años de estudio, la completitud según niveles, la asistencia a un centro educativo.
Mercado de trabajo (Employment): permite calcular la condición de actividad, la PEA (población económicamente activa), PET (población en edad de trabajar), PO (población ocupada) y PD (población desocupada), las restricciones al empleo, subempleo y las ramas de actividad según CIIU4.
Tipo de hogar (Household type): permite construir una tipología de hogar.
Ingresos y desigualdad (Income): permite calcular el ingreso deflactado (por el índice y año base elegido), quintiles y deciles de ingreso, el ingreso laboral per cápita y por hora.
Pobreza (Poverty): permite calcular pobreza e indigencia y las NBI (Necesidad Básicas Insatisfechas).
Se pueden estimar medias y proporciones, totales y ratios, el Índice de Gini, el Brecha salarial de género (GPG, por sus siglas en inglés Gender Pay Gap) y la relación quintil5/quintil1 (QSR, Quintil Share Ratio). Para los años 2018 y 2019 se cuenta con la información de las UPM (Unidades Primarias de Muestreo) y estratos por lo cual es posible definir correctamente el diseño de muestra y obtener intervalos de confianza correctos.
El paquete ech permite descargar los microdatos oficiales desde la
web del INE o bien utilizar microdatos ya procesados. En el primer caso
los datos se obtiene a través de la función
get_microdata()
. En el segundo caso, puede usar la función
read_microdata()
para leerlos. El paquete tiene tres
grandes conjuntos de funciones: - las que leen datos desde la web del
INE, se llaman get_(). - las que calculan variables tanto a nivel
hogares como personas, estas tienen nombres descriptivos en inglés que
se detallan más adelante. - las que estiman indicadores y calculan los
intervalos de confianza asociados, se llaman get_estimation_().
Ejemplo de descarga de microdatos:
Como un segundo paso, recomendamos utilizar la función
organize_names()
que estandariza los nombres de variables
llevándolas a los nombres de 2017. Este paso facilita el uso de las
demás funciones en la medida que todas contienen parámetros que dan
cuenta del nombre de alguna variable y cuyo valor por defecto es el
nombre de la variable para 2017. La correspondencia entre variables para
cada año se puede observar en el diccionario ech::dic
. No
todas las variables de la ech están contempladas en el diccionario por
lo que este proyecto está abierto a contribuciones que en la medida que
se agreguen nuevas funciones serán necesarias.
Para calcular las variables PEA, PET, PO y PD usamos la función
employment()
, especificando el nombre del objeto que
contiene los microdatos y la variable que contiene la información de la
condición de actividad (por defecto pobpcoac).
Otra función muy útil que combina además otra fuente de datos es
income_constant_prices()
que permite calcular el ingreso a
precios constantes, usando como deflactor el IPC o el IPAB. Es necesario
definir, el data frame, el año base y el mes base, y el tipo de IPC que
puede ser “G” (general) o “R” (regional). Este último solo está
disponible a partir de 2010.
Para estimar una variable, por ejemplo, pobre06 que ya viene en la
ECH calculada, elegimos la función de estimación adecuada, por ejemplo,
get_estimation_mean()
y definimos si queremos cruzarlo con
alguna otra variable o hacer una estimación en un dominio (por ejemplo,
solo el país urbano) y a nivel de hogares o personas.
El uso de este paquete se potencia al usarlo en conjunto con geouy ya que permite acceder a diferentes capas geográficas de Uruguay y construir mapas temáticos. Por ejemplo, a la estimación anterior de hogares pobres por departamento se le pueden agregar las geometrías de los polígonos de cada departamento para construir un mapa de coropletas.
Y con esto, podemos hacer un mapa con ggplot2
muy
fácilmente de estas estimaciones.
Este paquete se propone incorporar cualquier función de propósitos generales que utilice como base le Encuesta Continua de Hogares (ECH) de Uruguay. Todos los aportes en este sentido son bienvenidos.
Si trabajas con la ECH de Uruguay y querés agregar tu función o tus datos, te recomendamos que leas los siguientes consejos de como colaborar aquí. También podés generar un issue si encontrás algún error.
Si este paquete te parece útil también hacenoslo saber que es nuestro motor para seguir desarrollándolo.