Calculadora de desviación estándar

Calcula la desviación estándar muestral y poblacional, varianza, media, rango y estadísticas descriptivas completas de cualquier lista de números.

Cómo funciona

La desviación estándar mide la dispersión de un conjunto de datos en torno a su media — cuánto se desvían de promedio los valores individuales del promedio. Una desviación estándar pequeña significa datos muy agrupados; una grande, datos dispersos. Dos conjuntos pueden tener la misma media pero formas muy distintas, y la desviación estándar es el número único más común para describir esa diferencia. Ejemplo clásico: salarios en una startup con media de 80 000 € — si la desviación estándar es 5 000 €, todos ganan cerca de 80k; si es 40 000 €, los fundadores ganan 200k y los primeros empleados sobreviven con 50k. La media sola oculta la desigualdad.

Existen dos tipos de desviación estándar y elegir el correcto importa. La poblacional (σ, divide por n) se usa cuando tienes datos sobre cada miembro del grupo que te interesa — p. ej. las alturas de todos los jugadores de un equipo concreto. La muestral (s, divide por n−1) se usa cuando tu conjunto es una muestra aleatoria de una población mayor y quieres estimar la dispersión poblacional — p. ej. medir las alturas de 100 personas seleccionadas al azar para estimar la dispersión del país entero. El n−1 (corrección de Bessel) compensa que la media muestral es a su vez una estimación, que infraestima ligeramente la varianza poblacional verdadera si usas n ingenuamente. Usa muestral para casi cualquier inferencia; poblacional solo si genuinamente tienes toda la población (raro en la práctica).

La varianza es la desviación estándar al cuadrado — misma información, distintas unidades. La desviación estándar está en las mismas unidades que los datos originales (€, segundos, kg), lo que la hace interpretable; la varianza está en unidades al cuadrado (€², segundos², kg²), matemáticamente conveniente para demostraciones y cálculos pero menos intuitiva. La regla empírica (68-95-99,7) da intuición para distribuciones «normales»: aproximadamente el 68 % de los valores cae dentro de 1 desviación estándar de la media, el 95 % dentro de 2, y el 99,7 % dentro de 3. Así, en el ejemplo salarial, con media 80k y desviación 10k, esperarías que ~68 % de empleados ganen entre 70k y 90k. Los datos reales no siempre son perfectamente normales (especialmente ingresos, sesgados a la derecha), pero la regla sirve para una comprobación rápida.

La fórmula

Media: μ = (Σxᵢ) / n Varianza poblacional: σ² = Σ(xᵢ − μ)² / n Desviación estándar poblacional: σ = √σ² Varianza muestral: s² = Σ(xᵢ − x̄)² / (n − 1) Desviación estándar muestral: s = √s²

xᵢ son los puntos de datos individuales. n es el conteo. μ (mu) es la media poblacional; x̄ (x barra) la muestral — se computan igual pero convencionalmente usan símbolos distintos según el tratamiento. Σ significa suma sobre todos los puntos. El n−1 de la fórmula muestral es la corrección de Bessel.

Ejemplo de cálculo

  • Conjunto: 4, 8, 6, 5, 3, 7. n = 6.
  • Media = (4 + 8 + 6 + 5 + 3 + 7) / 6 = 33 / 6 = 5,5.
  • Desviaciones al cuadrado: (4−5,5)² = 2,25, (8−5,5)² = 6,25, (6−5,5)² = 0,25, (5−5,5)² = 0,25, (3−5,5)² = 6,25, (7−5,5)² = 2,25. Suma = 17,5.
  • Varianza poblacional = 17,5 / 6 ≈ 2,917; desviación poblacional = √2,917 ≈ 1,708. Varianza muestral = 17,5 / 5 = 3,5; desviación muestral = √3,5 ≈ 1,871. La muestral siempre es algo mayor por el denominador n−1.

Preguntas frecuentes

¿Uso la versión muestral (n−1) o poblacional (n)?

Por defecto, muestral (n−1) salvo que tengas datos reales sobre cada miembro del grupo. La fórmula n−1 compensa que la media muestral es una estimación, que infraestima la varianza poblacional real si usas n. En la práctica: análisis científico, A/B tests, sondeos, ingeniería de características en ML, análisis de retornos financieros — todo muestral. Las fórmulas poblacionales solo aplican si tu conjunto literalmente es toda la población (clase de 30 alumnos, todos los partidos de un equipo, todas las transacciones de un período cerrado). En la duda, usa muestral — la diferencia se desvanece para n grandes, y usar muestral cuando debías usar poblacional es mucho menos erróneo que al revés.

¿Cómo se diferencia desviación estándar del error estándar?

La desviación estándar describe la dispersión de los puntos individuales dentro de una muestra. El error estándar describe la dispersión de las medias muestrales entre muchas muestras hipotéticas — responde a «¿cuánto cambiaría la media si tomara otra muestra al azar?». Matemáticamente, error estándar = desviación / √n, así que disminuye con muestras mayores (más datos, más confianza en la media). Se usan para fines distintos: desviación cuando describes variabilidad de los datos; error cuando expresas incertidumbre sobre una estimación (p. ej. «la media poblacional es 50 ± 2», donde 2 es el error estándar). Los intervalos de confianza y los p-valores se construyen con errores estándar, no con desviaciones.

¿La desviación estándar puede ser negativa?

No. La desviación estándar es la raíz cuadrada de la varianza, y la varianza es una suma de desviaciones al cuadrado dividida por un conteo positivo — ambas cantidades intermedias son siempre no negativas, así que el resultado debe ser ≥ 0. Es exactamente 0 cuando todos los puntos igualan a la media (todos los valores idénticos, sin variabilidad). Resultados negativos en una calculadora siempre indican error de entrada o cálculo. La «desviación» individual (xᵢ − μ) puede ser positiva o negativa, pero la desviación estándar es la magnitud típica de esas desviaciones, expresada como un número positivo.

Calculadoras relacionadas