Capítulo 3 Índices de Similitud

¿Cuán similares son dos localidades?, vamos a calcular dos tipos de similitudes una basada en incidencia (presencia-ausencia de especies) (ej. Índices de Sorensen, Jaccard y Simpson), y otra basada en la abundancia, Porcentaje de Similitud. Imaginemos que tenemos cuatro localidades (A, B, C, D) donde recogemos los datos de densidad de cuatro especies; Tabebuia billbergii, Geoffroea spinosa,Ceiba trichistandra y Colicodendron scabridum, especies características de bosques secos tropicales. Podemos introducir datos hipotéticos de abundancia para cada especie en cada una de las localidades.

dens <- data.frame(T.bil = c(1, 1, 2, 3), G.spi = c(21, 8, 13, 5),
                   C.tri = c(11, 3, 7, 5), C.sca = c(16, 0, 9, 4))
row.names(dens) <- LETTERS[1:4]
dens
##   T.bil G.spi C.tri C.sca
## A     1    21    11    16
## B     1     8     3     0
## C     2    13     7     9
## D     3     5     5     4

Generamos un gráfico basado en las dos primeras especies para ver cuánto se parece cada sitio (Figura 3.1).

par(mar=c(4,4,1,1), mgp=c(1,0.3,0), tcl= -0.2)
plot(dens[,1:2], type = "n", cex.axis=0.8, xlim=c(0,20), ylim=c(0,25)) 
text(dens[,1:2], row.names(dens), col ="blue")
Similitud de cuatro localidades hipotéticas

Figure 3.1: Similitud de cuatro localidades hipotéticas

En la figura 3.1 vemos que la composición de especies en el sitio A es diferente de la composición del sitio D. Es decir, la similitud entre el sitio A y D es menor que entre los otros sitios. Lo siguiente que nos deberíamos preguntar es; ¿qué tan similares son los dos sitios?

3.1 Índices cualitativos

Los índices cualitativos o de incidencia, son una medida que nos permite evaluar la similitud entre comunidades basados en presencia-ausencia de especies. A continuación veremos tres diferentes índices:

\[S_s= \frac{(2c)}{(a+b+2c)}\] Índice de Sorensen

\[S_s= \frac{(c)}{(a+b+c)}\] Índice de Jaccard

\[S_s= \frac{(c)}{c+min(a+b)}\] Índice de Simpson

Donde c es el número de especies en común entre los dos sitios, a y b son el número de especies únicas en cada sitio. Las diferencias entre estos índices radica en la importancia que se le da a cada componente, en el caso del índice de Sorensen las especies compartidas tienen una gran importancia, por eso es multiplicada por dos. En el caso del índice de Simpson, es un índice usado cuando hay diferencias muy altas entre pares de comunidades, así restamos el peso obteniendo el valor mínimo de entre a y b.

Para calcular estos índices entre los sitios A y B necesitamos definir el número de especies compartidas y luego el número de especies únicas de los dos sitios.

comp <- dens
comp[comp>0] <- 1 #Generamos una matriz de presencia ausencia
comp
##   T.bil G.spi C.tri C.sca
## A     1     1     1     1
## B     1     1     1     0
## C     1     1     1     1
## D     1     1     1     1
a <- sum(colSums(comp[1:2,])==1&comp[2,]==0)#Ocurren en A pero no en B
b <- sum(colSums(comp[1:2,])==1&comp[1,]==0)#Ocurren en B pero no en A
c <- sum(colSums(comp[1:2,])==2) #ocurren en A y B

a;b;c
## [1] 1
## [1] 0
## [1] 3

Ahora obtenemos el valor de similitud entre los dos primeros sitios (A y B).

Sor <- (2*c)/(a+b+(2*c))
Jac <- c/(a+b+c)
Sim <- c/c+min(a,b)

Sor; Jac; Sim
## [1] 0.8571429
## [1] 0.75
## [1] 1

Según el índice de Sorensen estos dos sitios son parecidos en un 86%, mientras que para el índice de Jaccard es el 75% y para Simpson estos dos sitios son iguales (100%).

3.2 Índices cuantitativos

El porcentaje de similitud es la versión cuantitativa del índice de Sorensen. Este índice está basado en datos de abundancia y es calculado como:

\[S_s= \frac{(2W)}{A+B}\] Porcentaje de Similitud

Donde; W es la sumatoria del valor mínimo de la abundancia entre las comunidades comparadas para cada especie. A y B es la suma de las abundancias de todas las especies en cada sitio.

Table 3.1: Medidas para obtener el porcentaje de Similitud
T.bil G.spi C.tri C.sca Medidas Tipo
A 1 21 11 16 49 A
B 1 8 3 0 12 B
3 1 8 3 0 12 W
PS <- (2*MatPS[3,5])/(MatPS[1,5]+MatPS[2,5])
PS
## [1] 0.3934426

Esto significa que las comunidades A y B tienen un porcentaje de similitud del 39%. Los datos de los dos tipos de índices utilizados difieren entre sí, el porcentaje de similitud utiliza no solamente la presencia-ausencia sino también la abundancia lo que podría estar reduciendo la similitud entre sitios.