分割表
分割表とは、質的変数の関係を表した表です。
2つの質的変数を利用している場合、二元分割表といいます。
分割表は、クロス集計やカイ二乗検定や尤度比検定などで利用されます。
クロス集計表
クロス集計表とは、カテゴリーデータを2つ以上組み合わせて縦軸と横軸で集計した表です。
人 | 肥満 | 肥満でない | 計 |
---|---|---|---|
運動している | 2 | 8 | 10 |
運動していない | 8 | 2 | 10 |
計 | 10 | 10 | 20 |
オッズ比
オッズとは、条件において確率を示します。
先ほどのクロス集計表で、運動による肥満の有無のオッズを次の記号として表します。
人 | 肥満 | 肥満でない |
---|---|---|
運動している | A | B |
運動していない | C | D |
運動していることにより肥満でないオッズは、A/Bとして確率を求めます。
運動していないことにより肥満でないオッズは、C/Dとして確率を求めます。
オッズ比とは、先で求めたオッズから(A/B)/(C/D)として運動の有無による肥満の有無を比率で表示します。
運動することで肥満にならない比率は、「0.0625」と求められて運動していないことで肥満になる確率は16倍と求めれます。
対数オッズ
対数オッズとは、オッズを対数化することで得られる量です。
これは、ロジスティック回帰などの統計モデルで非常に便利であり、確率を直接扱うのではなく、対数オッズを扱うことで、線形モデルを適用しやすくなります。
連関係数
連関係数は、二つの変数間の関係の強さや方向性を測定する統計的指標です。
連関係数にはさまざまな種類があり、それぞれ異なるタイプのデータや関係を測定するために使用されます
ファイ係数
ファイ係数とは、2つの二項変数間の関係の強さを測定するための統計的指標です。
これは、2x2のクロス集計表に基づいて計算され、主に名義尺度データの間の関係を評価する際に使用されます。
対数線形モデル
対数線形モデルは、主に離散データを扱う統計モデルの一つであり、特にクロス集計表や分割表の分析に適用されます。
このモデルは、カテゴリカルデータの頻度分布や関連性を調べるために使用されます。
階層モデル
階層モデルとは、複数の階層からなるデータ構造を適切にモデル化するための有力な手法です。
特に、個別のデータポイントが属するグループや集団の影響を考慮する場合に重要です。
条件付き独立性
条件付き独立性とは、確率モデルの構築や推定において重要な概念です。
特にベイズ統計学やグラフィカルモデルなどで、変数間の依存関係や独立性をモデル化する際に使用されます。
グラフィカルモデル
グラフィカルモデルとは、複数の変数間の依存関係をグラフ構造で表現し、その依存関係を理解し、推論や学習を行うための強力なツールです。
これにより、複雑なデータの解析や予測がより効果的に行われることが可能となります。