Calculadora de índice de diversidad

Calcula los índices de Shannon, Simpson y la equitatividad de Pielou a partir de una lista de recuentos de especies — para ecología, microbioma y análisis de comunidades.

Cómo funciona

La alfa-diversidad pregunta dos cosas a la vez sobre una muestra de una comunidad: cuántas especies diferentes hay (riqueza) y con qué uniformidad están distribuidos los individuos entre ellas (equitatividad). Los índices clásicos combinan ambas ideas en un único número, ponderándolas de forma distinta. La calculadora toma una lista de recuentos — uno por especie, en cualquier formato de texto razonable — y devuelve las cuatro métricas más usadas: Shannon-Wiener H′, Gini-Simpson 1−D, Simpson inverso 1/D y la equitatividad de Pielou J′. Las cuatro se calculan a partir del mismo vector de proporciones (p_i = n_i / N) y las diferencias residen en qué operación matemática se aplica.

Shannon-Wiener H′ = −Σ p_i ln(p_i) es la entropía de la distribución: «¿qué sorpresa tendría al sacar un individuo al azar?», alta cuando hay muchas especies y las abundancias son uniformes. Se reporta en nats con logaritmo natural (lo que usa esta calculadora) o en bits con log₂ — la elección no afecta a las comparaciones entre muestras mientras seas consistente. La D de Simpson = Σ p_i² es la probabilidad de que dos individuos al azar pertenezcan a la misma especie; cuanto más uniforme la comunidad, menor D. Gini-Simpson 1−D invierte esto para que «más alto = más diverso» (lo que la mayoría llama «diversidad de Simpson»). El Simpson inverso 1/D tiene la propiedad atractiva de comportarse como un «número efectivo de especies» — una comunidad con 1/D = 5 tiene la misma diversidad que una perfectamente uniforme de 5 especies, independientemente de cuántas especies raras haya en la cola. La J′ de Pielou = H′ / ln(S) divide Shannon entre su máximo teórico y da una puntuación de equitatividad entre 0 y 1, útil para comparar muestras con diferente número de especies.

Tres puntos prácticos. (1) Los índices solo son comparables a esfuerzo de muestreo fijo. Una muestra de 16S rRNA con 50 000 reads parecerá más diversa que la misma comunidad secuenciada a 5 000 reads, simplemente porque un muestreo más profundo descubre más especies raras. La práctica estándar en microbioma es rarefaccionar todas las muestras a la misma profundidad antes de calcular la diversidad, o usar un estimador basado en cobertura. (2) La definición de «qué cuenta como especie» importa tanto como el índice. En microbioma, agrupar por OTU al 97 % frente a resolución ASV da números de diversidad meaningfully distintos sobre los mismos datos. Sé explícito sobre tu unidad de análisis. (3) Shannon y Simpson discrepan en cuánto peso dar a las especies raras. Shannon les da más peso (porque ln(p) explota cuando p tiende a cero), Simpson casi ninguno. Si tu comunidad tiene una larga cola de singletons que sospechas son errores de secuenciación, Simpson será más robusto; si esas especies raras son biológicamente reales e importan a tu pregunta, Shannon las respeta.

La fórmula

Proporciones: p_i = n_i / N Shannon (H′): H′ = −Σ p_i × ln(p_i) Simpson (D): D = Σ p_i² Gini-Simpson: 1 − D Simpson inverso: 1 / D Equitatividad J′: J′ = H′ / ln(S)

n_i es el recuento de la especie i, N es el total de todos los recuentos (Σ n_i) y S es el número de especies con n_i > 0 (riqueza). La calculadora usa logaritmo natural en todos los cálculos, así que Shannon H′ está en nats; multiplica por 1/ln(2) ≈ 1,443 para convertir a bits si lo necesitas. La J′ de Pielou no está definida cuando S = 1 (solo una especie — no hay máximo teórico contra el que comparar), así que la calculadora la muestra como no aplicable en ese caso. Los singletons (n_i = 1) cuentan plenamente en la riqueza y en Shannon, pero muy poco en Simpson porque su p_i² es minúsculo.

Ejemplo de cálculo

  • Muestra con 5 especies, recuentos: 50, 25, 15, 7, 3 (total N = 100).
  • Proporciones: 0,50, 0,25, 0,15, 0,07, 0,03.
  • Shannon H′ = −(0,50·ln 0,50 + 0,25·ln 0,25 + 0,15·ln 0,15 + 0,07·ln 0,07 + 0,03·ln 0,03) ≈ 1,265 nats.
  • Simpson D = 0,50² + 0,25² + 0,15² + 0,07² + 0,03² ≈ 0,344. Gini-Simpson 1−D ≈ 0,656. Inverso 1/D ≈ 2,91. Pielou J′ = 1,265/ln(5) ≈ 0,786.

Preguntas frecuentes

¿Reporto Shannon, Simpson, o los dos?

Ambos, cuando hay espacio. Resaltan cosas distintas: Shannon es más sensible a la riqueza y a las especies raras, Simpson es más sensible a la equitatividad entre las especies dominantes. Una comunidad donde Shannon y Simpson discrepan (uno dice «muy diversa», el otro «moderada») suele ser una con una larga cola de especies raras — y cuál respuesta es la «correcta» depende de tu pregunta científica. En artículos de ecología, reportar los dos junto con la riqueza (S) es la norma y deja que el lector interprete los datos a su modo. En microbioma, la convención converge en reportar al menos Shannon y Simpson inverso, a menudo junto a la diversidad filogenética de Faith (que esta calculadora no calcula — necesitas un árbol). Si has de elegir uno solo para un resumen, el Simpson inverso es el más fácil de interpretar porque tiene unidades de «número efectivo de especies» — un número que un no especialista puede entender al instante.

¿Por qué una secuenciación más profunda eleva mi Shannon?

Porque un muestreo más profundo descubre más especies raras, y las raras empujan la riqueza al alza — Shannon incluye un término de riqueza, así que sube mecánicamente con el número de reads. La misma comunidad secuenciada a 1 000 o a 50 000 reads puede mostrar valores de Shannon significativamente distintos solo por la profundidad, no por biología. Dos arreglos estándar. (1) Rarefacción: submuestrea cada muestra al menor número de reads de tu set antes de calcular diversidad. Pierdes datos reales pero las muestras quedan comparables. (2) Usa estimadores basados en cobertura o en modelos (p. ej. los números de Hill vía iNEXT, o Chao1 para la riqueza sola) que tienen en cuenta el esfuerzo de muestreo de forma explícita. Para un cálculo puntual de una muestra, el Shannon crudo está bien si reportas el número de reads; para comparaciones entre muestras, no compares nunca Shannon crudo entre muestras secuenciadas a profundidades distintas.

¿Qué formatos de entrada acepta la calculadora?

Cualquier cosa que contenga una lista de recuentos numéricos. El parser extrae cada número del texto pegado y lo trata como un recuento de especie, así que puedes pegar una columna de Excel, una lista separada por comas, una tabla con nombres en una columna y recuentos en otra, o incluso una frase como «La especie A tuvo 12 individuos, la B tuvo 7». Los nombres de especies se ignoran — solo importan los recuentos. Los recuentos cero se descartan (una especie con cero observaciones no está en la muestra). Los números negativos se ignoran silenciosamente como errores de entrada. Si tienes una hoja con varias muestras y quieres diversidad para cada una, ejecútalas una a una; la calculadora calcula la diversidad de una sola muestra por envío, no de una matriz.

Mi equitatividad de Pielou es 1,00 — ¿es correcto?

Sí — J′ = 1 significa que la comunidad es perfectamente equitativa, es decir, todas las especies tienen el mismo recuento. Matemáticamente es cuando Shannon alcanza su máximo teórico ln(S) y J′ = H′/ln(S) = 1. Es raro verlo en datos ecológicos o de microbioma reales porque las comunidades reales casi siempre tienen algo de desigualdad; si ves exactamente 1,00, comprueba que tu entrada no fuera por accidente una lista de números idénticos (p. ej. pegaste frecuencias relativas tras redondear al mismo valor, o tienes una columna constante de la hoja). En el otro extremo, J′ tiende a 0 cuando una especie domina por completo; J′ = 0 implicaría una «comunidad» de una sola especie, que la calculadora marca como no aplicable para equitatividad porque no hay máximo teórico contra el que comparar (S = 1 hace ln(S) = 0).

Calculadoras relacionadas