Datos de panel — Efectos fijos
Genera el código R (plm) o Stata (xtreg, fe) para estimar un modelo de datos de panel con efectos fijos.
¿Qué son los datos de panel?
Los datos de panel (o longitudinales) combinan dimensión de corte transversal (varios individuos: empresas, países, hogares…) con dimensión temporal (varios periodos por individuo). Esta estructura permite controlar características inobservables que no varían en el tiempo y mejoran sustancialmente la identificación causal frente a un corte transversal puro.
Modelo de efectos fijos (within)
El estimador de efectos fijos resta a cada variable su media por individuo, eliminando así todo lo que es constante en el tiempo dentro de cada unidad (talento del trabajador, cultura de la empresa, geografía del país…). Es la forma más habitual de eliminar el sesgo por variable omitida en la práctica aplicada.
Su principal ventaja es que permite que el efecto inobservado esté correlacionado con los regresores, lo que el modelo de efectos aleatorios no tolera. Su coste: no se pueden estimar coeficientes de variables que no varían en el tiempo dentro del individuo (sexo, raza, sector si nunca cambia…), porque desaparecen al hacer la transformación within.
La sintaxis generada, explicada
En R, el paquete plm define la estructura de panel con
pdata.frame(datos, index = c("id", "tiempo")) y estima con
plm(..., model = "within"). En Stata, primero se declara
el panel con xtset id tiempo y después xtreg ..., fe hace el
trabajo. Con la opción de errores robustos del formulario, el código emite errores
estándar clusterizados por individuo (vcovHC con
cluster = "group" en R, vce(cluster id) en Stata), que es lo
correcto cuando se sospecha autocorrelación dentro del panel.
Cuándo elegir efectos fijos
- Cuando el efecto inobservado puede estar correlacionado con los regresores.
- Cuando solo te interesan los efectos de variables que varían en el tiempo.
- Cuando el test de Hausman rechaza efectos aleatorios.
Errores frecuentes
- No declarar el panel. En Stata sin
xtsetno funcionaxtreg; en R sinpdata.frame,plmno sabe la estructura. - Querer estimar variables invariantes en el tiempo. FE no las identifica; quedan absorbidas en el efecto individual.
- Usar errores estándar no agrupados. En panel se suele asumir autocorrelación dentro del individuo, por lo que los errores agrupados son lo estándar.
Preguntas frecuentes
¿FE o RE? Decide con el test de Hausman; si rechaza, usa FE.
¿Necesito panel balanceado? No, plm y xtreg
funcionan con paneles no balanceados.
¿Qué pasa con la constante? En efectos fijos within se absorbe en los efectos individuales; no se estima.