Análisis de clasificación
En este capítulo presentaremos los métodos de clasificación, conocidos también como análisis de conglomerados o cluster analysis. Estos métodos son muy populares en el contexto de la estadística multivariada. En efecto, fueron de las primeras aproximaciones multivariadas que se incorporaron a las ciencias ambientales. Sin embargo, haremos énfasis sobre la utilidad de estas herramientas para el contexto específico en que fueron diseñadas: la detección de grupos cuando a priori no reconocemos la existencia de grupos. En este sentido, el contenido de este capítulo se divide en las siguientes secciones:
Principios de clasificación no restringida. En esta sección se presentarán los tres principales tipos de clasificación empleados en situaciones en que no tenemos una variable causal reconocida. Estos métodos son: clasificación jerárquica, divisiva y por aglomeración. Para cada uno se describirá la lógica implícita, los principios de cálculo, pero sobre todo su aplicabilidad en ciencias ambientales. De estos tres se hará especial énfasis en el método jerárquico.
Prueba de hipótesis para dendogramas. Unas de las principales etapas del análisis de clasificación es reconocer qué grupos son realmente relevantes y cuáles grupos son producto de artefactos algorítmicos. En este segmento describiremos la prueba de perfiles de similitud o similarity profiles test como metodología para detección de grupos estadísticamente significativos.
Gráficos con dendrogramas. Si bien los dendogramas son difíciles de apreciar cuendo el conjunto de datos es grande, son muy útiles como estrategia complementaria de visualización de datos. En este segmento presentaremos los heatmap o shade plot.
Principios de clasificación restringida. Se suelen dar situaciones en que a priori reconocemos que cualquier agrupación multivariada que tengan los datos BEA puede deberse a cambios en una variable independiente que hemos medido. En este caso, la clasificación puede incorporar esa variable como elemento definitorio en la identificación de grupos. Para ello presentaremos los árboles de vinculación o LINKTRE.
Existe mucha literatura que se puede consultar al respecto, tanto libros como artículos científicos. Uno de los libros más importantes, Numerical Ecology (Legendre y Legendre 2012), dedica un capítulo completo al análisis de clasificación, con un enfoque fundamentalmente matemático de los procedimientos en las técnicas más comunes. Otro buen libro que dedica varios capítulos al análisis de clasificación aplicado a ciencias ambientales es el libro Changes in Marine Communities (Clarke et al. 2014). A diferencia del primero, este libro se centra en la aplicación del método y sus diferentes técnicas, evitando entrar en exceso de detalles matemáticos para precisamente mantener la atención del lector.