Download Algunas tecnicas basicas
Document related concepts
no text concepts found
Transcript
Algunas técnicas básicas Luis Rosero Bixby University of California at Berkeley Las técnicas 1. Agregación 2. Suavizamiento 3. Ajuste a control macro 4. Normalización (La mayoría son en realidad consejos de programación) 1. Agregación • Para pasar de micro-datos a promedios por edades • Comando Stata para promedios ponderados: collapse (mean) x y z [weight=facexpan], by(age) • “facexpan” son los factores de expansión de la muestra (pudimos modificarlos para reproducir la estimación de la pob. por edades simples) • Para tener también el número de observaciones y la población en cada edad: generate unos = 1 Collapse (rawsum) unos (sum) fexpan (mean)…. 2. Suavizamiento (Apéndice B) • Para reducir el ruido del muestreo por trabajar con edades simples • Se suavizan los niveles más bajos (ejemplo: YE y YS) • Los niveles mas altos se obtienen por suma (YL no se suaviza!) • No sobre-suavizar picos, valles y ceros reales • Los valores falsos negativos deben reemplazarse con ceros • No incluir en el suavizamiento edades que por definición tienen ceros (ej. niños en YL) 2. Suavizamiento con Stata • Se trabaja con el archivo de promedio de edades • Se usa la técnica de regresión local (lowess) lowess Y age, bw(0.1) gen(Ysua) • Jugar con valores alternativos de band width (bw) • Debido a que lowess no permite weight se usa el truco de expandir la muestra (p. ej. una línea por cada 10 observaciones) antes de suavizar. gen obs10 = round(nobs/10) expand obs10, gen(duplicada) lowess..... drop if duplicada==1 3. Ajuste a control macro Cálculo del factor de corrección Cálculo perfiles ajustados 3. Ajuste a control macro en stata * control macro gen yle_macro = 15542 * agregados crudos (con valores suavizados) egen double yle_tot = total(pob2006/1000000 * yle_sua) *Factor de correccion gen fyle = yle_macro / yle_tot *Valores ajustados al control gen YLE = fyle * yle_s 4. Normalización Porque al comparar perfiles, nos interesa más la forma que el nivel de la curva. 4. Cómo se normaliza • Se calcula el promedio YL edades 30-49 (unidad de ingreso): egen YL3049 = mean(YL) if edad>=30 & edad<=49 replace YL3049 = YL3049[35] if YL3049==. (Esta es una constante para todas las edades) • YL normalizado es el YL relativo al de edades 30-49: gen YL_nor = YL/YL3049 Laboratorio 4. Técnicas básicas Aplicar las técnicas básicas de: 1. 2. 3. 4. Agregación Suavizamiento Ajuste a control macro Normalización Para completar la estimación del ingreso laboral (Código para hacerlo con Ecuador 2006 en: YL-ECua-Part2.do)