平均絶対偏差(Mean Absolute Deviation, MAD)は、統計学においてデータの散らばり具合を表す指標の一つです。データが平均値からどの程度離れて分布しているかを示すために使われます。平均絶対偏差を理解するには、まず「平均」と「偏差」の概念を把握する必要があります。
平均とは、データの総和をデータの個数で割った値です。たとえば、5人の生徒のテストの点数がそれぞれ70点、80点、90点、60点、100点だった場合、これらの平均は(70+80+90+60+100)÷ 5 = 80点となります。
偏差とは、各データが平均からどれだけ離れているかを示す値です。上記の例で言うと、70点の生徒の偏差は70 – 80 = -10点、80点の生徒の偏差は80 – 80 = 0点、というように計算されます。
平均絶対偏差は、これらの偏差の絶対値(マイナスの符号を取り除いた値)を全て足し合わせて、データの個数で割ったものです。絶対値を使う理由は、単純に偏差を足し合わせるとプラスとマイナスが相殺されてしまい、実際の散らばり具合が分からなくなるからです。
先ほどのテストの点数を例にとると、平均絶対偏差は以下のように計算されます。
- 各データの偏差の絶対値を求める
- 70点の生徒:|70 – 80| = 10
- 80点の生徒:|80 – 80| = 0
- 90点の生徒:|90 – 80| = 10
- 60点の生徒:|60 – 80| = 20
- 100点の生徒:|100 – 80| = 20
- これらの絶対値を全て足し合わせる10 + 0 + 10 + 20 + 20 = 60
- 足し合わせた値をデータの個数で割る60 ÷ 5 = 12
この場合、平均絶対偏差は12点となります。これは、各生徒のテストの点数が平均値から平均して12点離れていることを意味します。
平均絶対偏差は、データのばらつきを測るためによく使われる「標準偏差」と似ていますが、外れ値(極端に高い値や低い値)の影響を受けにくいという特徴があります。そのため、外れ値が含まれるデータセットを扱う際には、平均絶対偏差が有用な指標となることがあります。
平均絶対偏差は、金融分析や品質管理など様々な分野でデータの変動性を評価するために使用されます。また、データがどの程度集中しているか、あるいは散らばっているかを知るための基本的なツールとしても役立ちます。