分割表

分割表とは、質的変数の関係を表した表です。
2つの質的変数を利用している場合、二元分割表といいます。 分割表は、クロス集計やカイ二乗検定や尤度比検定などで利用されます。

クロス集計表

クロス集計表とは、カテゴリーデータを2つ以上組み合わせて縦軸と横軸で集計した表です。

肥満 肥満でない
運動している 2 8 10
運動していない 8 2 10
10 10 20

オッズ比

オッズとは、条件において確率を示します。
先ほどのクロス集計表で、運動による肥満の有無のオッズを次の記号として表します。

肥満 肥満でない
運動している A B
運動していない C D

運動していることにより肥満でないオッズは、A/Bとして確率を求めます。
運動していないことにより肥満でないオッズは、C/Dとして確率を求めます。

オッズ比とは、先で求めたオッズから(A/B)/(C/D)として運動の有無による肥満の有無を比率で表示します。
運動することで肥満にならない比率は、「0.0625」と求められて運動していないことで肥満になる確率は16倍と求めれます。

対数オッズ

対数オッズとは、オッズを対数化することで得られる量です。
これは、ロジスティック回帰などの統計モデルで非常に便利であり、確率を直接扱うのではなく、対数オッズを扱うことで、線形モデルを適用しやすくなります。

連関係数

連関係数は、二つの変数間の関係の強さや方向性を測定する統計的指標です。
連関係数にはさまざまな種類があり、それぞれ異なるタイプのデータや関係を測定するために使用されます

ファイ係数

ファイ係数とは、2つの二項変数間の関係の強さを測定するための統計的指標です。
これは、2x2のクロス集計表に基づいて計算され、主に名義尺度データの間の関係を評価する際に使用されます。

対数線形モデル

対数線形モデルは、主に離散データを扱う統計モデルの一つであり、特にクロス集計表や分割表の分析に適用されます。
このモデルは、カテゴリカルデータの頻度分布や関連性を調べるために使用されます。

階層モデル

階層モデルとは、複数の階層からなるデータ構造を適切にモデル化するための有力な手法です。
特に、個別のデータポイントが属するグループや集団の影響を考慮する場合に重要です。

条件付き独立性

条件付き独立性とは、確率モデルの構築や推定において重要な概念です。
特にベイズ統計学やグラフィカルモデルなどで、変数間の依存関係や独立性をモデル化する際に使用されます。

グラフィカルモデル

グラフィカルモデルとは、複数の変数間の依存関係をグラフ構造で表現し、その依存関係を理解し、推論や学習を行うための強力なツールです。
これにより、複雑なデータの解析や予測がより効果的に行われることが可能となります。