4 Notación de matrices y parámetros multivariados

4.1 Conceptos básicos

El álgebra de matrices es una rama de las matemáticas que se centra en el estudio de las matrices y sus operaciones. Como hemos visto en la sección anterior (figura 3.1), los datos BEA multivariados se representan en matrices cuyas filas corresponden a los objetos estudiados y las columnas a las variables que definen a esos objetos. Matemáticamente, las principales características de las matrices incluyen:

Tamaño: Una matriz se caracteriza por su tamaño, que está dado por el número de filas y columnas que contiene. Por ejemplo, una matriz con P filas y N columnas se denomina matriz de tamaño P ⨯ N.
Elementos: Cada entrada individual en una matriz se conoce como un elemento. Los elementos de una matriz pueden ser números reales, complejos o incluso funciones.
Notación: Las matrices suelen representarse utilizando letras mayúsculas, como A, B o C. Los elementos individuales de una matriz se denotan utilizando subíndices. Por ejemplo, a_ij representa el elemento en la fila i y columna j de la matriz A.
Tipos de matrices: Hay varios tipos de matrices, incluyendo matrices cuadradas (mismo número de filas y columnas), matrices de fila (una sola fila), matrices de columna (una sola columna), matrices diagonales (todos los elementos fuera de la diagonal principal son cero), entre otros (figura 4.1).

Fig. 4.1: Representación de los tipos de matrices

Los procedimientos estadísticos multivariados tradicionales se fundamentan en álgebra matricial. Algunas de estas aproximaciones son los Análisis de Componentes Principales (PCA por sus siglas en inglés) y los análisis multivariados de varianza (MANOVA). Las peculiaridades metodológicas para las operaciones algebraicas de matrices BEA están fuera del alcance de este libro. Sin embargo, podemos destacar las principales reglas de operación que se usan en los procedimientos estadísticos multivariadas basados en álgebra de matrices pues eventualmente será necesario desarrollarlos con propósitos demostrativos. Estas son:

Adición y sustracción de matrices: La suma o resta se restringe a matrices del mismo tamaño. La operación se realiza sumando (o restando) los elementos correspondientes de cada matriz para obtener una nueva matriz con los mismos dimensiones.
Multiplicación de matrices: La multiplicación de matrices es una operación más complicada. Se realiza multiplicando filas por columnas y sumando los productos resultantes. Es importante destacar que no todas las combinaciones de matrices pueden multiplicarse entre sí, ya que el número de columnas de la primera matriz debe ser igual al número de filas de la segunda matriz.
Multiplicación por un escalar: Se puede multiplicar una matriz por un número escalar multiplicando cada elemento de la matriz por ese número.
División de matrices: La división entre matrices no está definida, pero es posible multiplicar una matriz por otra matriz (o por un escalar) que contenga los inversos de los elementos correspondientes.
Transposición: La transposición de una matriz implica intercambiar sus filas por columnas y viceversa. Esto se indica con una t sobrescrita, como A^t.
Inversión de matrices: La matriz inversa de una matriz A es aquella que multiplicada por la propia matriz A resulta en la matriz identidad, es decir: AA^-1 = I. Es importante destacar que solo tienen matriz inversa aquellas matrices cuadradas que no sean singulares, es decir, aquellas cuyo determinante no sea igual a cero.

¿qué es un determinante?

El determinante de una matriz es una cantidad escalar asociada a esa matriz, y es un concepto fundamental en el álgebra lineal. El determinante proporciona información importante sobre la matriz, como su invertibilidad y la relación entre sus vectores filas o columnas.

El determinante de una matriz cuadrada A de tamaño n ⨯ n se denota como (A) o |A|. Para calcular el determinante, se pueden utilizar diversos métodos, como la regla de Sarrus para matrices de ( 2 ⨯ 2 ) o mediante expansiones de cofactores para matrices de mayor tamaño.

Para una matriz A ( 2 ⨯ 2 ), el determinante se calcula como:

\[\begin{equation} A =\begin{pmatrix} a & b \\ c & d \\ \end{pmatrix} \end{equation}\] \[\begin{equation} |A| = ad - bc \\ \end{equation}\]

Para una matriz A ( 3 ⨯ 3 ), se puede usar la regla de Sarrus:

\[\begin{equation} A = \begin{pmatrix} a & b & c\\ d & e & f\\ g & h & i \end{pmatrix} \end{equation}\] \[\begin{equation} |A|= aei + bfg + cdh - ceg - bdi - afh \\ \end{equation}\]

Para matrices de tamaño mayor, se puede utilizar la expansión por cofactores, donde se elige una fila o columna, se calcula el cofactor de cada elemento de esa fila o columna, se multiplica cada cofactor por el elemento correspondiente y se suman estos productos. Este proceso se repite para cada fila o columna. El cálculo del determinante es fundamental en los análisis multivariados convencionales. Como podrán notar, invertir matrices es un procedimiento tedioso y demandante, particularmente en matrices grandes, por lo que son operaciones realizadas en computadoras.

4.2 Número de muestras y número de variables: ¿es singular la matriz?

Para el PCA, MANOVA y otras aproximaciones multivariadas convencionales, se debe calcular la matriz de covarianza (o correlación) de los datos. Luego, será necesario aplicar la mayoría de los procedimientos enlistados arriba según corresponda, siendo la inversión de la matriz de covarianza el procedimiento más crítico. Específicamente, cuando hay más variables que muestras, la matriz de covarianza es singular (determinante igual a 0) y, por lo tanto, no invertible. Esto impide completar los pasos necesarios para aplicar un MANOVA o cualquier otro método convencional en que la inversión de matriz sea requerida. En el caso del PCA, aunque puede calcularse mediante descomposición en valores singulares (SVD) sin invertir la matriz, la singularidad sigue siendo un indicador de colinealidad severa o de insuficiencia de muestras, que afectará en la proyección de los puntos, afectando la interpretación y limitando el uso de de esta técnica visual a situaciones en que N > P.

Código

# Paquetes necesarios
library(readxl)
library(dplyr)
library(knitr)
library(tibble)

# Cargar datos ambientales
datos_amb <- read_excel("datos/datos_ambientales_PNLR.xlsx")

# Crear tabla
kable(
  tibble(
  " " = " Determinante",  # primera columna
 "N > P" = # segunda columna
datos_amb|>
  select(7:22)|> #se seleccionan solo las variables fisicoquímicas
  as.matrix()|> #convertir en matriz
  cor()|> # estimar matriz de correlaciones
  det()|> # Estimar determinante
  round(digits = 10),
 "N < P" = #tercera columna
datos_amb|>
  filter(Muestreo == 1)|>
  select(7:22)|>
  as.matrix()|>
  cor()|>
  det()|>
  round(digits = 10)
))

Esto se puede demostrar con los siguientes comandos en R y los datos ambientales de Guerra-Castro et al. (2021). La tabla 4.1 muestra el determiante de la matriz de correlaciones a las 16 variables fisicoquímicas usando las 60 filas (N > P) así como el determinante a la matríz de correlaciones con solo las primeras 12 estimaciones del primer período de muestreo (N < P). Despliegue el código para identificar los pasos y cómo la función det se encarga de hacer los procedimientos algebraicos para estimar la determinante.

Tabla 4.1: Determinantes a la matriz de correlaciones de las 16 variables fisicoquimicas usando todas las estimaciones del estudio (N = 60) así como a solo las estimaciones del primer muestreo (N = 12)

	N > P	N < P
Determinante	2.7e-06	0

Como se puede apreciar en este ejemplo, es frecuente que los datos BEA no sean candidatos para aplicar métodos multivariados que requieren de álgebra de matrices. Específicamente, en situaciones en que tengamos más variables que muestras no se pueden aplicar métodos que requieran invertir matrices. Si bien esto fue por mucho tiempo una restricción importante que justificó todo un desarrollo metodológico no-paramétrico multivariado (Clarke 1993), más adelante veremos como algunas proyecciones semi-métricas relativamente más recientes permitirán nuevamente el uso del álgebra matricial.