estimacion_ingresos.Rmd
La medición de los ingresos tiene un rezago de un mes ya que si el hogar fue encuestado, por ejemplo en marzo, en este mes se preguntó por los ingresos del mes pasado, es decir de febrero. A su vez, estos ingresos están expresados a precios corrientes, por lo cual, para hacerlos comparables entre los diferentes meses de la encuesta o de otros años es necesario llevarlos a una medida común. Para convertir los ingresos de precios corrientes a precios constantes debemos elegir un índice como puede ser el IPC (Índice de Precios al Consumo) o el IPAB (Índice de Precios de Alimentos y Bebidas) para construir un deflactor. Por ejemplo, para expresar los ingresos del hogar con la información de la ECH 2019, elegimos como mes base junio y como año base 2019 y como deflactor el IPC. Esto implica que debemos considerar los valores del IPC mensual desde diciembre 2018 a noviembre 2019.
Obtener los datos del IPC es bastante sencillo usando el paquete
ech
, para ello existe la fucnión de hecho la función
get_ipc()
que descarga el archivo de la web del INE y lo
guarda en un formato tidy en el data frame ipc_base2010
. La
estructura del objeto es la siguiente:
tail(ech::ipc_base2010)
#> # A tibble: 6 x 8
#> fecha indice mensual acum_~1 acum_~2 trime~3 cuatr~4 semes~5
#> <date> <chr> <chr> <chr> <chr> <chr> <chr> <chr>
#> 1 2022-03-01 250.41999999999999 1.11000~ 4.4199~ 9.3800~ 4.4243~ 4.3199~ 5.6713~
#> 2 2022-04-01 251.65000000000001 0.48999~ 4.9400~ 9.3699~ 3.0972~ 4.9372~ 5.0993~
#> 3 2022-05-01 252.81999999999999 0.46000~ 5.4299~ 9.3699~ 2.0752~ 3.5765~ 5.3197~
#> 4 2022-06-01 254.30000000000001 0.58999~ 6.04 9.2899~ 1.5493~ 2.6728~ 6.0422~
#> 5 2022-07-01 256.25999999999999 0.77000~ 6.8600~ 9.5600~ 1.8319~ 2.3320~ 4.9858~
#> 6 2022-08-01 258.38 0.82999~ 7.7400~ 9.5299~ 2.1991~ 2.6743~ 4.3200~
#> # ... with abbreviated variable names 1: acum_ano, 2: acum_12_meses,
#> # 3: trimestre, 4: cuatrimestre, 5: semestre
La función que permite obtener un deflactor es la función deflate(),
que a su vez, utiliza internamente la función get_ipc()
. No
utilizamos directamente ninguna de estas funciones, sino que la
simplicidad de ech radica en que para calcular ingresos a precios
constantes usamos la función income_constant_prices()
la
cual utiliza internamente las otras dos funciones ya mencionadas.
Antes de deflactar los ingresos del hogar, tenemos que tener cargado el objeto con los microdatos de la ECH.
library(ech)
df <- get_microdata(year = 2019, folder = tempdir(), toR = FALSE)
#df <- organize_names(df)
Las variables a tener en cuenta en esta parte son:
ht11
: Ingreso total del hogar con valor locativo sin
servicio domésticoht13
: Valor locativoht19
: Cantidad de personas sin servicio domésticonumero
: Identificador del hogarPara convertir los ingresos del hogar, que están medidos en la
variable ht11
, de precios corrientes a precios constantes,
usamos la función income_constant_prices()
y definimos sus
parámetros: mes base (base_month
), año base
(base_year
), el tipo de índice (index
) que
puede IPC o IPAB y el nivel del índice (level
) que puede
ser “G” (general) o “R” (regional que distingue entre Montevideo e
Interior). Definimos como base enero de 2005.
df <- income_constant_prices(data = df, base_month = 1, base_year = 2005, index = "IPC", level = "G")
Esto crea una serie de variables:
y_pc
: ingreso per cápita a precios corrientesy_pc_d
: ingreso per cápita a precios constantesrv_d
: valor locativo a precios constantesy_wrv_d
: ingreso sin valor locativo a precios
constantesy_wrv_pc_d
: ingreso sin valor locativo per cápita a
precios constantesPara obtener la estimación de alguna de estas variables usamos la
función get_estimation_mean()
, para estimar la media,
get_estimation_total()
, para estimar el total o
get_estimation_median()
para estimar la mediana. Estas
funciones tienen algunos argumentos que refieren al diseño de muestreo
como:
numero
: se debe indicar la variable que identifica a
los hogarespesoano
: se debe indicar la variable uqe identifica los
pesos asociados a cada hogar.ids
: se debe indicar la variable que identifica a la
unidades primarias de muestreo.estrato
: se debe indicar la variable que identifica a
los estratos.Para los microdatos de 2018 y 2019 la ECH pública cuenta con la
información de las UPM y estratos. En la web del INE se encuentra en un
archivo aparte pero la función get_microdata()
ya la agrega
a los microdatos que genera de manera que no es necesario hacer un merge
entre ambas bases. Para años anteriores no están disponible estás
variables en la base pública.
Es necesario definir ids
y estrato
que
vienen con valor por defecto NULL, las demás se pueden dejar con sus
valores por defecto, salvo que se usen registros de un mes o semestre en
ese caso se debe cambiar el ponderador de los casos según
corresponda.
get_estimation_mean(df, variable = "y_pc_d", level = "i", ids = "upm", estrato = "estrato")
Para estimar el ingreso medio de los hogares a precios constantes de enero 2005 según departamento, se debe definir en el argumento by.x la variable “nomdpto”
# Estimación de ingresos promedio per cápita a pesos constantes de ene/05 según dpto
get_estimation_mean(df, variable = "y_pc_d", by.x = "nomdpto", level = "i", ids = "upm", estrato = "estrato")
Podemos comparar estos resultados con los publicados por el Observatorio Territorio Uruguay de OPP que se encuentran aquí.