Question 1

Shannon と Simpson、どちらを報告すべき？

Accepted Answer

スペースが許すなら、両方の報告を推奨します。両者は強調する点が異なります：Shannon は種数（richness）と希少種に敏感、Simpson は優占種同士の均等度に敏感。Shannon と Simpson が「非常に多様 vs 中程度」のように一致しない群集は、たいてい「希少種の長い裾」を持つ群集で、どちらが「正しい」かは研究上の問いに依存します。生態学の論文では、両方の指数と richness（S）を併記するのが標準で、読者が自分の解釈で読めるようになります。マイクロバイオーム分野では、慣習として最低でも Shannon と逆 Simpson を併記し、しばしば Faith の系統的多様性も併記されます（これは本ツールでは計算できません — 別途系統樹が必要）。1 つだけ選ぶ必要があるなら、逆 Simpson が最も解釈しやすい：単位が「実効種数（effective number of species）」なので、専門外の読者にも直感的に伝わります。

Question 2

なぜシーケンシング深度を上げると Shannon が高くなる？

Accepted Answer

深いシーケンシングほど希少種を多く発見できるためで、希少種は richness を押し上げます — Shannon には「richness の寄与」が含まれているので、reads 数の増加に伴って機械的に上昇します。同じ群集を 1,000 reads と 50,000 reads で読むと、Shannon 値は「生物学的差」ではなく「サンプリング深度の違い」だけで意味のある差を示しえます。標準的な対処は 2 つ。(1) Rarefaction：データセット中の最も少ない reads 数に合わせて、各サンプルをサブサンプリングしてから多様性を計算する。実データを一部捨てる代わりに、サンプル間が直接比較可能になる。(2) カバレッジベース、またはモデルベースの推定量を使う（例：iNEXT による Hill numbers、richness 単独なら Chao1 など） — サンプリング努力量を明示的に補正してくれます。1 サンプルだけの単発計算なら、reads 数を併記すれば生の Shannon を報告するのは問題ありません。サンプル間比較では、シーケンシング深度が違うサンプル同士で「生の Shannon」を比べてはいけません。

Question 3

どのような入力形式に対応していますか？

Accepted Answer

「数値の個体数のリスト」が含まれていれば、ほぼ何でも受け付けます。パーサは貼り付けられたテキストから数値トークンをすべて抽出し、それぞれを「1 種ぶんの個体数」として扱います — Excel のセル列、カンマ区切りリスト、種名と個体数が別列のタブ区切り表、さらには「種 A は 12 個体、種 B は 7 個体」のような文章まで OK です。種名は無視され、計算には個体数のみが使われます。0 はサンプルに含まれない種として除外、負の値は入力エラーとして黙って無視します。複数サンプルが入った行列に対して各サンプルの多様性を計算したい場合は、サンプルごとに 1 回ずつ実行してください — 本ツールは「1 回の入力 = 1 サンプル」での多様性のみを計算し、行列入力には対応しません。

Question 4

Pielou 均等度が 1.00 になりました — これは正しい？

Accepted Answer

はい — J′ = 1 は「群集が完全に均等」、つまりすべての種が同じ個体数であることを意味します。数学的には、Shannon が理論最大値 ln(S) に達した状態で、J′ = H′/ln(S) = 1 となります。現実の生態学・マイクロバイオームのデータでは滅多に出ません — 実在の群集はほぼ常になにがしかの偏りを持つためです。もし J′ がちょうど 1.00 になった場合、入力が誤って「すべて同じ数値の列」になっていないかを確認してください（例：相対頻度を四捨五入して同じ値に丸まった、Excel の定数列を貼り付けた、など）。逆の極端では、ある 1 種が完全に優占すると J′ は 0 に近づきます。J′ = 0 は「種が 1 つだけの群集」を意味しますが、その場合は比較すべき理論最大がないため（S = 1 だと ln(S) = 0）、本ツールは均等度を「該当なし」と表示します。

多様性指数計算機

使い方

計算式

計算例

よくある質問

関連計算機