Una revisión del supuesto MAR en datos faltantes de la EPH
Palabras clave:
Datos faltantes, Ingresos, Análisis multivariadoResumen
Un problema frecuente trabajando con datos de la EPH del INDEC en Argentina es la presencia de valores perdidos en los ingresos monetarios. En la literatura se encuentra un variado conjunto de instrumentos estadísticos para lidiar con esta dificultad. La eficacia de estas técnicas depende críticamente del mecanismo de generación de los valores perdidos. En general, estos procedimientos requieren como mínimo que los datos omitidos sean missing at random (MAR). En este trabajo se analizan las diferencias entre declarantes y no declarantes de ingresos en la EPH con datos del IV trimestre 2020. Dada la naturaleza categórica de los datos disponibles, primero se realiza un análisis de correspondencias múltiples (ACM) y pruebas de homogeneidad para identificar de manera exploratoria en qué variables se observan diferencias significativas. Luego se lleva a cabo una regresión logística para determinar cuáles son los factores principales que contribuyen a explicar la falta de respuesta. Los resultados señalan que hay diferencias significativas entre declarantes y no declarantes en un conjunto importante de características relevadas por la EPH. Sexo, región geográfica, educación, sector de actividad (público/privado) y tipo de ocupación son los principales determinantes de la no declaración de ingresos. De acuerdo a estos hallazgos, quienes tienen mayor propensión a no informar sus ingresos monetarios son los varones casados con educación secundaria o universitaria, que trabajan en el sector privado como cuentapropistas y residen en el área metropolitana de Buenos Aires o en la región pampeana.
Descargas
Referencias
CEDLAS -Centro de Estudios Distributivos, Laborales y Sociales- (2018) La pobreza en Argentina: recuperando la comparabilidad. Blog del CEDLAS [blog] Enero 2018. Disponible en http://www.cedlas.econo.unlp.edu.ar/wp/la-pobreza-en-argentina-recuperando-la-comparabilidad/ [Consultado el 16/05/2022]
Donza, E. (2013) Método de imputación de la no respuesta en las preguntas de ingresos en la Encuesta Permanente de Hogares. Gran Buenos Aires 1990-2010. X Jornadas de Sociología. Celebradas del 1 al 7 de julio de 2013 en la Facultad de Ciencias Sociales de la Universidad de Buenos Aires. Disponible en https://cdsa.aacademica.org/000-038/769 [Consultado el 16/05/2022]
Durrant, B. G. (2005) Imputation Methods for Handling Item-Non-response in the Social Science: A Methodological Review. ESRC National Centre for Research Methods and Southampton Statistical Science Research Institute, University of Southampton, NCRM Methods Review Papers, NCMR/002.
Kalton, G. y Kasprzyk, D. (1986) The treatment of missing survey data. Survey Methodology, 12 (1), pp. 1-16. Disponible en https://www150.statcan.gc.ca/n1/en/pub/12-001-x/1986001/article/14404-eng.pdf?st=I9PNi553 [Consultado el 16/05/2022]
Medina, H. F. y Galván, M. (2007) Imputación de datos: Teoría y práctica. Serie Estudios estadísticos y prospectivos, Nº 54, Santiago de Chile: CEPAL. Disponible en https://repositorio.cepal.org/handle/11362/4755 [Consultado el 16/05/2022]
Moneta Pizarro, A. M. (2021) Econometría. Córdoba: Editorial de la Facultad de Ciencias Económicas de la UNC. Disponible en https://rdu.unc.edu.ar/handle/11086/20732 [Consultado el 16/05/2022]
Rosatti, G. (2019) Imputación de datos perdidos mediante técnicas de Machine Learning: un experimento usando la Encuesta Permanente de Hogares. Congreso Nacional de Estudios del Trabajo. Celebrado del 7 al 9 de agosto de 2019 en Buenos Aires. Disponible en https://www.researchgate.net/publication/334961016 [Consultado el 16/05/2022]
Salvia, A. (2019) Tiempo de balances. Pobreza, exclusión y desigualdad en la Argentina urbana (2010-2018). XV Jornadas Argentinas de Estudios de Población. Celebradas del 18 al 20 de septiembre de 2019 en la Universidad Nacional de San Juan. Disponible en https://wadmin.uca.edu.ar/public/ckeditor/Observatorio%20Deuda%20Social/Presentaciones%202018/2018/2018-Observatorio-Pobreza-Desigualdad-Dialogos.pdf [Consultado el 16/05/2022]
Sonnet, F. H., Juárez Jérez, H. G., y Moneta Pizarro, A. M. (2009) Dos décadas de transformaciones de la empresa agropecuaria argentina y sus efectos macroeconómicos. El caso de la Provincia de Córdoba. XL Reunión Anual de la Asociación Argentina de Economía Agraria. Celebrada del 7 al 9 de octubre de 2009 en la Universidad Nacional del Sur, Bahía Blanca.
Tornarolli, L. (2018) Series Comparables de Indigencia y Pobreza: Una Propuesta Metodológica. Documento de Trabajo, Nro. 226 abril. La Plata: CEDLAS. Disponible en https://www.cedlas.econo.unlp.edu.ar/wp/wp-content/uploads/doc_cedlas226.pdf [Consultado el 16/05/2022]
Vera, J., y Salvia, A. (2019) Pobreza y desigualdad monetaria en los hogares urbanos de la Argentina a partir de la Encuesta de la Deuda Social Argentina (2010-2018). Revisión, actualización metodológica y nuevos resultados. Documento de Trabajo. Pontificia Universidad Católica Argentina, Observatorio de la Deuda Social Argentina. Disponible en https://repositorio.uca.edu.ar/handle/123456789/8298 [Consultado el 16/05/2022]
Zack, G., Schteingart, D. y Favata, F. (2020) Pobreza e indigencia en Argentina: construcción de una serie completa y metodológicamente homogénea. Sociedad y economía, (40), pp. 69-98. Disponible en http://www.scielo.org.co/pdf/soec/n40/1657-6357-soec-40-00069.pdf [Consultado el 16/05/2022]
Archivos adicionales
Publicado
Número
Sección
Licencia
Derechos de autor 2022 Documentos de Trabajo de Investigación de la Facultad de Ciencias Económicas (DTI-FCE)
Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-SinDerivadas 4.0.