¿Qué rayos es un análisis factorial?

Repsi

¿Qué rayos es un análisis factorial?

Mg. Nicolás Vizioli

Uno/a intenta tomar instrumentos, leer papers, pisteando como campeón/a. De repente se encuentra una y otra vez con el mismo término salvaje que se acerca amenazante: “análisis factorial”. Para colmo, a veces nos encontramos con lo que parecen ser distintos tipos de análisis factorial y no llegamos a entender que está pasando. El objetivo de este artículo es explicar brevemente qué demonios quiere decir análisis factorial (AF).

Podríamos comenzar este largo camino de descubrimiento diciendo que el AF es un modelo estadístico que representa las relaciones entre un conjunto de variables. ¿Qué es una variable? Una variable es una característica que puede variar (valga la redundancia) y puede adoptar distintos valores, y es susceptible de ser medida. Estas relaciones existentes entre un conjunto de variables observables pueden explicarse a partir de variables no observables o latentes, que se llaman factores (Ferrando & Anguiano-Carrasco, 2010). Para decirlo en criollo, el AF permite realizar correlaciones con el propósito de agrupar una importante cantidad de rasgos en un número limitado de factores (Mikulic et al., 2015). Por ejemplo, los ítems de un test psicológico serían variables observables que explican una variable latente. Para comprender mejor esta idea, vayamos al caso del Inventario de Depresión de Beck (BDI II; Beck et al., 2006; adaptación argentina: Brenlla & Rodríguez, 2006). Evidentemente, el constructo abordado por el BDI II es la sintomatología depresiva. Sin embargo, la depresión no resulta directamente observable. De la misma manera que la gripe no es directamente observable. Lo que uno puede observar en ambas patologías son las sintomatologías. En el caso del BDI II, cada ítem representa un síntoma característico de cuadros depresivos. Lo importante es llevarnos la idea de que los ítems representan partes del constructo que se desea medir.

Entonces, el AF permite explicar las relaciones entre variables observables que por ejemplo podrían ser ítems de un test psicológico(como podrían ser una serie de afirmaciones a las que se responde v/f), en un número menor de factores o variables no observables, a partir de matrices de correlaciones. Resulta que los ítems podrían entenderse como formas de hacer observables ciertos atributos psicológicos no observables, como se desarrolló con el ejemplo del BDI II. Ahora, probablemente estén preguntándose qué es una matriz de correlaciones.  Muy rústicamente uno podría pensar una matriz de correlaciones como una tabla que permite conocer la fuerza y dirección de la relación entre variables. Dependiendo de nuestros datos, es decir, si son continuos, dicotómicos o politómicos, vamos a trabajar con matrices de correlaciones de Pearson, tetracóricas o policóricas respectivamente.

Un caso que permitiría ejemplificar lo que es un AF podría ser el de la construcción del NEO-Pi. Es un instrumento que evalúa los cinco factores de la personalidad y fue desarrollado por Costa & Mc Crae en 1985. Tal y como lo relatan Mikulic et al. (2015), este instrumento surge a partir de una tendencia desarrollada a partir de distintas investigaciones, que se planteaban reducir a las palabras que permitieran describir a la personalidad en un número reducido de factores. Como resultado de este trabajo empírico llevado adelante mediante AFs, surge el modelo de los cinco factores de la personalidad. Ni más ni menos que el más aceptado, investigado y difundido en la actualidad.

Volviendo al AF, hay una nueva dificultad: si uno ha sido un lector atento ha visto que en la literatura investigativa pueden hallarse distintos tipos de modelos que pueden prestarse a confusión: el análisis factorial exploratorio (AFE), el análisis de componentes principales (ACP) y el análisis factorial confirmatorio (AFC).

Tal vez lo que se viene desarrollando hasta el párrafo anterior hace más justicia a lo que vendría a ser el AFE: permite explorar el conjunto de variables latentes comunes que explican las respuestas obtenidas para los ítems de un instrumento (Lloret-Segura et al, 2014). Este método estadístico muchas veces se confunde con el ACP. Inclusive, verán algunos artículos científicos ya antiguos (el tiempo pasa rápido) en los cuales ambos métodos se intercambian como si sirvieran para lo mismo. De hecho, muchos Padawanes nos hemos comido la curva por estos trabajos realizados por antiguos Maestros Jedis. Probablemente hemos sido corregidos por otros miembros de la Orden Jedi también. Porque resulta que el AFE y el ACP no sirven para lo mismo. ¿Por qué?  Porque su finalidad es distinta. Mientras que el objetivo del ACP consiste en reducir variables observables para explicar la misma cantidad de varianza con menos variables (Conway & Huffcutt, 2003), el AFE permite hallar factores latentes representados en variables observables (DeCoster, 1998).  Para quienes no recuerdan que es la varianza, podría ser suficiente con decir que se trata de una medida de dispersión que representa la variabilidad de los datos. Para profundizar, en el caso del ACP los componentes no son variables no observables ni los ítems son medidas indirectas de ellos. En cambio, el AFE parte del supuesto de que las variables observables o ítems son indicadores de variables no observables o latentes, los factores (Lloret-Segura et al., 2014).

Ahora toca hablar del AFC. Probablemente entender este proceso es como enfrentar al zombie más grande e indestructible en el Resident Evil o el Last of Us. Sin embargo todos y todas hemos ganado o conocemos a alguien que ganó esos juegos que hacen justicia al mes de Octubre. Si bien me provocaron ganas de jugar a la Play, es posible empezar diciendo que las bases del AFE y del AFC son distintas. Aunque ambos son métodos que permiten examinar la estructura factorial de un instrumento (¿alguien dijo validez?), el AFC tiene la particularidad de que la propia persona encargada de la investigación es quien establece el número de factores relacionados entre sí, y qué ítems se relacionan con cada factor (Lloret-Segura et al., 2014). No es que uno lo inventa arbitrariamente, sino que lo que uno establece para realizar el AFC es resultado de investigaciones anteriores (estado del arte, como le dicen). Inclusive, uno podría decir que el AFE permite establecer un modelo teórico a partir de estudios empíricos, y el AFC probar ese modelo. Es que los resultados del AFC permiten ver en qué medida un modelo determinado ajusta a los datos que uno pudo recolectar. Es más, el AFC permite comparar distintos modelos entre sí. Una dulzura.

 

Conclusión

 

El objetivo de este trabajito fue intentar comprender de qué hablamos cuando hablamos de AF. Si bien se ha recorrido alguna definición y se ha visto alguna diferencia entre AFE, ACP y AFC, es posible que aún tengan dudas al respecto. La verdad es que en muchos casos los programas estadísticos confunden y pareciera que es todo lo mismo. Sin embargo, ahora conocemos un poco más, para no dejarnos engañar. Van a encontrar algunas complejidades más tanto en los AFE como en los ACP o los AFC. En los AFE verán que se utilizan distintas matrices de correlaciones, distintos métodos de extracción, cuando utilizar ACP o AFC…Para todos esos problemas la lectura recomendada es la de Lloret-Segura et al (2014), que encontrarán entre las referencias.

Para finalizar ¿En qué softwares pueden hacer AF preguntan? Depende. Para AFE o ACP, tal vez el recomendado sea el Factor (Lorenzo-Seva & Ferrando, 2020), que es muy completo y gratuito. Si querés realizar AFE, ACP o AFC por tu cuenta, la opción gratuita, aunque no tan amigable es sin dudas el R con los paquetes GPArotation y psych en el primer y segundo caso, y lavaan en el tercero. Anímense al R Studio también que no muerde y siempre tengan en cuenta al paquete Rcmdr. Aunque hay distintos programas si uno puede piratear o pagar.

 

Así que la próxima vez que vean un AF salvaje que ha aparecido, atrápenlo ya.

 

Referencias

  • Beck, A. T., Steer, R. A. & Brown, G. K. (2006). Inventario de Depresión de Beck (BDI-II), Manual. Paidós.

  • Brenlla, M. E. Rodríguez, C. M. (2006). Adaptación argentina del Inventario de Depresión de Beck (BDI-II). Paidós.

  • Conway, J. M., & Huffcutt, A. I. (2003). A review and evaluation of exploratory factor analysis practices in organizational research. Organizational Research Methods, 6, 147-168. https://doi.org/10.2110.1177/1094428103251541

  • Costa, P. & McCrae, R. (1985). NEO Personality Inventory Manual. P.A.R.

  • DeCoster, J. (1998). Overview of Factor Analysis. http://www.stat-help.com/factor.pdf

  • Ferrando, P. J., & Anguiano-Carrasco, C. (2010). El análisis factorial como técnica de investigación en psicología. Papeles del psicólogo, 31(1), 18-33. https://www.monica-gonzalez.com/AF.pdf

  • Lloret-Segura, S., Ferreres-Traver, A., Hernández-Baeza, A., & Tomás-Marco, I. (2014). El análisis factorial exploratorio de los ítems: una guía práctica, revisada y actualizada. Anales de Psicología/Annals of Psychology, 30(3), 1151-1169. http://dx.doi.org/10.6018/analesps.30.3.199361

  • Lorenzo-Seva, U. & Ferrando, P. (2020). Manual of the program FACTOR v. 10. http://psico.fcep.urv.es/utilitats/factor/index.html

  • Mikulic, I.M., Crespi, M.C, & Fernández, G.L. (2015) El Inventario de Personalidad Neo-Pi-R: guía para su Administración e Interpretación. Facultad de Psicología de la Universidad de Buenos Aires.
  •