標準偏差計算機

任意の数列から、標本/母集団の標準偏差、分散、平均、範囲、各種記述統計量を計算。

使い方

標準偏差はデータセットの平均周りの散らばりを測る指標で、個々の値が平均からどれだけ離れているかを示します。標準偏差が小さければデータは平均近くに密集、大きければ散らばっている。同じ平均でも形が大きく異なるデータセットは存在し、その違いを 1 つの数字で表す最もよく使われる指標が標準偏差です。古典的な例:スタートアップの給与で平均 800 万円 — 標準偏差 50 万円なら全員ほぼ 800 万円付近、400 万円なら創業者は 2,000 万円・初期社員は 500 万円。平均だけでは不平等が見えません。

標準偏差には 2 種類あり、正しく選ぶことが重要です。母集団標準偏差(σ、n で割る)は、関心ある集団の全員のデータがある場合に使う — 例:あるバスケットチームの全選手の身長。標本標準偏差(s、n−1 で割る)は、データセットがより大きな母集団からの無作為標本で、母集団の散らばりを推定したい場合に使う — 例:無作為に選んだ 100 人の身長を測って国全体の散らばりを推定。n−1(ベッセル補正)は、標本平均自体が推定値であり、素朴に n で割ると真の母集団分散をやや過小評価することを補正します。推測統計のほぼすべてには「標本」を使い、本当に母集団全体がある稀なケースでのみ「母集団」を使います。

分散は標準偏差を二乗したもの — 情報は同じ、単位が違う。標準偏差は元データと同じ単位(円、秒、kg)で解釈しやすい;分散は二乗単位(円²、秒²、kg²)で、証明や計算には便利ですが直感に乏しい。「経験則(68-95-99.7 ルール)」は正規分布の直感を与えます:値の約 68% が平均 ±1 標準偏差、約 95% が ±2、約 99.7% が ±3 の範囲。給与例で平均 800 万・標準偏差 100 万なら、約 68% の社員が 700〜900 万円。実データは完全な正規分布ではない場合が多い(特に所得は右に歪む)ものの、健全性チェックとして有用です。

計算式

平均:μ = (Σxᵢ) / n 母集団分散:σ² = Σ(xᵢ − μ)² / n 母集団標準偏差:σ = √σ² 標本分散:s² = Σ(xᵢ − x̄)² / (n − 1) 標本標準偏差:s = √s²

xᵢ は個々のデータ点。n はデータ点の個数。μ(ミュー)は母集団平均、x̄(エックスバー)は標本平均 — 計算は同じですが、データを母集団として扱うか標本として扱うかで慣例的に異なる記号を使います。Σ は全データ点にわたる総和。標本式の n−1 はベッセル補正。

計算例

  • データ:4、8、6、5、3、7。n = 6。
  • 平均 = (4 + 8 + 6 + 5 + 3 + 7) / 6 = 33 / 6 = 5.5。
  • 偏差の二乗:(4−5.5)² = 2.25、(8−5.5)² = 6.25、(6−5.5)² = 0.25、(5−5.5)² = 0.25、(3−5.5)² = 6.25、(7−5.5)² = 2.25。合計 = 17.5。
  • 母集団分散 = 17.5 / 6 ≈ 2.917、母集団標準偏差 = √2.917 ≈ 1.708。標本分散 = 17.5 / 5 = 3.5、標本標準偏差 = √3.5 ≈ 1.871。分母が n−1 なので、標本値は常にやや大きくなります。

よくある質問

標本(n−1)と母集団(n)どちらを使うべき?

基本的には標本(n−1)を使うこと — 関心ある集団の全員のデータが本当にある場合のみ母集団。n−1 の式は、標本平均自体が推定値であり、n で割ると真の母集団分散を過小評価することを補正します。実務では:科学的分析、A/B テスト、世論調査、ML の特徴量エンジニアリング、金融リターン分析 — すべて標本。母集団の式が当てはまるのは、データセットが文字通り母集団全体である場合のみ(30 名のクラス、ある 1 チームの全試合、閉じた期間の全取引)。迷ったら標本を — n が大きければ違いはほぼ消えますし、本来母集団を使うべき場面で標本を使う方が、その逆よりはるかに誤差が小さい。

標準偏差と標準誤差はどう違う?

標準偏差は単一サンプル内の個々のデータ点の散らばりを表します。標準誤差は多数の仮想的なサンプル間で「標本平均」がどれくらいばらつくかを表す — 「別の無作為標本を引き直したら平均はどれくらい変わるか」を答えます。数学的には、標準誤差 = 標準偏差 / √n なので、サンプルサイズが大きいほど縮小(データ量が多いほど平均への信頼が高い)。用途が異なる:標準偏差はデータのばらつきの記述、標準誤差は推定値の不確実性の表現(例:「母集団平均は 50 ± 2」、この 2 が標準誤差)。信頼区間や p 値は標準誤差から構築され、標準偏差からではない。

標準偏差は負の値になりますか?

いいえ。標準偏差は分散の平方根で、分散は「偏差の二乗の総和」を「正の個数」で割ったものです — 中間の量はどちらも常に非負なので、結果は必ず ≥ 0。すべてのデータ点が平均と等しい(つまりすべての値が同一でばらつきなし)場合のみ 0 になります。計算機で負の値が出た場合は必ず入力ミスか計算エラーです。個々の「偏差」(xᵢ − μ)は正でも負でもあり得ますが、標準偏差はそれらの偏差の典型的な大きさを正の数で表したものです。

関連計算機