Modelo Logit Multinomial
Genera el código R (nnet::multinom) o Stata (mlogit) para estimar un modelo Logit Multinomial (dependiente categórica sin orden).
¿Cuándo se usa un Logit Multinomial?
El Logit Multinomial se aplica cuando la variable dependiente es categórica y no tiene un orden natural. Es la herramienta clásica para modelos de elección discreta sin jerarquía entre alternativas: medio de transporte elegido (coche, autobús, tren, bicicleta), marca comprada, partido votado, sector en el que trabaja un individuo. Si las categorías sí estuvieran ordenadas, lo correcto sería un Logit ordinal, no multinomial.
La idea: cada categoría se compara con una base
El modelo elige una categoría base de referencia y estima los coeficientes que explican la probabilidad de elegir cada una de las demás categorías frente a esa. Si tu dependiente tiene 4 alternativas y la base es "coche", el modelo estima un conjunto de coeficientes para "autobús vs coche", otro para "tren vs coche" y otro para "bicicleta vs coche". La elección de la base no cambia las predicciones, solo la interpretación de los coeficientes.
Cómo interpretar los resultados
Los coeficientes son log-odds frente a la categoría base. Su exponencial da los Cocientes de Riesgo Relativo (Relative Risk Ratios, RRR), el análogo multinomial de las odds ratios. Un RRR mayor que 1 significa que un aumento del regresor incrementa la probabilidad relativa de esa categoría respecto a la base; menor que 1, la reduce. Para cuantificar el efecto sobre la probabilidad absoluta de cada categoría se usan los efectos marginales.
La sintaxis generada, explicada
En R, multinom() del paquete nnet estima el
modelo; exp(coef(modelo)) devuelve los RRR. La categoría base se fija con
relevel(factor(...), ref = "categoria"). En Stata, el
comando es mlogit; la opción baseoutcome(valor) fija la
categoría de referencia y rrr muestra los RRR directamente.
Errores frecuentes
- Olvidar fijar la categoría base. El programa toma una por defecto y la interpretación de los coeficientes depende de cuál sea.
- Confundir RRR con probabilidades. Son cocientes relativos frente a la base, no probabilidades.
- Usarlo con categorías ordenadas. Pierde información del orden; mejor Logit ordinal.
- IIA (Independencia de alternativas irrelevantes). Es un supuesto fuerte del Logit multinomial; si no se cumple, conviene un Logit anidado.
Preguntas frecuentes
¿Qué pasa si cambio la categoría base? Las predicciones no cambian; solo cambia cómo se interpretan los coeficientes (siempre son "X vs base").
¿Multinomial o ordinal? Si las categorías tienen orden natural, ordinal; si no, multinomial.
¿Qué es la IIA? El supuesto de que añadir o quitar una alternativa no altera la elección entre las otras. Si no se cumple, considera un Logit anidado.