平均値と中央値は真ん中をどのようにして求めるかという点が異なります。
エクセルの計算や統計などでよく見かけますが、どっちがどっちだろうと思った経験はありませんか?
そこで今回は平均値と中央値の違いをわかりやすく丁寧にご説明します。
このページの目次
「平均値」と「中央値」の違い
平均値と中央値は以下のような違いがあります。
- 平均値
全ての値を足して、全ての値の個数で割った数 - 中央値
全ての値を並べた時に中間に位置する値
平均値とは、「全ての値を足して、全ての値の個数で割った数」です。
一方で、中央値は「全ての値を並べた時に中間に位置する値」という意味です。
このように値そのものも異なれば、算出方法も異なります。
また、平均値は全体を考慮できる一方で、極端な数があれば値が変化してしまいます。
一方で、中央値は極端な数があってもブレませんが、全体を考慮できない可能性があります。
それでは、それぞれ詳しく見てみましょう。
「平均値」の意味
平均値とは「全ての値を足して、全ての値の個数で割った数」です。
たとえば、「1、2、3」という数が並んでいたとします。
この場合、「1、2、3」を足し合わせると、1+2+3=6になります。
そして、「1、2、3」という数が3つあるので、合計の数である6を3で割ります。
そうすると、2になるので、こちらが平均値になります。
「平均値」の特徴と例
平均値には以下のような特徴があります。
- 小さい数から大きい数まで全ての数の関係性を反映可能
- ずば抜けて大きい数字や小さい数字があった時にブレが生じる
平均値は全ての値をきちんと考慮できますが、ずば抜けた数字があった時にデータがぶれてしまいます。
たとえば、「1、2、3」の平均値は2ですが、「1、2、97」であれば、50となってしまい偏りが生じます。
「中央値」の意味
中央値とは「全ての値を並べた時に中間に位置する値」という意味です。
たとえば、「1、2、3」という数が並んでいたとします。
数を小さい順に並べると、2が中央に位置します。
そのため、中央値が2になります。
値の数が偶数で真ん中の数が2つ存在する時は、その中央に近い2つの数の平均値を中央値として扱います。
「中央値」の特徴と例
中央値には以下のような特徴があります。
- ずば抜けて大きい数字や小さい数字があったとしても値が左右されにくい
- 全ての数字の関係性が反映されているとは言えない
ずば抜けて小さい、もしくは大きい数字があったとしても中央値はブレにくいです。
一方で、「1、6、1000」の中央値は6ですが、1と1000との関係性が十分に反映されていない値になってしまいます。
「平均値」と「中央値」の使い分け
平均値と中央値が一致しない場合、以下のように使い分けるとよいでしょう。
- 平均値と中央値の数を比較して、より一層数の関係性を正確に表しているものを使う
平均値と中央値が同じような値になっている時は、平均値を優先します。
しかし、ずば抜けて大きな数や小さい数があった場合、平均値と中央値は大きくズレて、中央値の方がが現実に近くなるので、中央値を使いましょう。
全体の数と偏りがないかどうかチェックすることが大事です。
また、具体的なシチューエーションでは以下のように使い分けるとよいでしょう。
- 平均値
ある値の数が大体どれくらいか知りたい時 - 中央値
全体の中心の値を知りたい時
ちなみに、使い分けをする時やデータをみる時に役に立つのが標準偏差です。
校長を使った見分け方とは?
ネット上では校長を使った平均値と中央値の違いが話題です。
自宅からわいせつな写真が見つかってニュースになった校長がネタとなって広まりました。
1万2000人の売春容疑もあって、その数字がネット上で計算のネタにもなっています。
たとえば、校長Aが1万2000人、校長Bが2人、校長Cが1人の売春容疑をかけられていたとします。
中央値はこの場合2人ですが平均値は4001人となり、中央値の方が実態に近いことを感じられます。
「標準偏差」とは
標準偏差とは、それぞれの値がどれだけばらつきがあるかを表す数字です。
標準偏差を使えば、平均値から値がどれだけ離れているか知ることが可能です。
平方根を使った計算が必要なので手で計算するのは複雑ですが、簡単に記すと以下のような式になります。
- {(値1-平均点)の2乗+(値2-平均点)の2乗+…(値X-平均点)の2乗}/値の個数の平方根
「1、2、3」という数字があった場合、以下のように求めることができます。
- {(1-2)の2乗+(2-2)の2乗+…(3-2)の2乗}/3の平方根
√2/3(√6/3)=およそ0.816…という値になります。
この場合だと、「およその数は平均値の2から大体0.816の範囲内にいる」と解釈可能です。
「年収」の計算は「平均値」と「中央値」のどっち?
年収の計算は中央値を調べた方が現実に近いと言われています。
今まで平均年収という指標がメディアなどで使用されてきましたが、平均年収にも問題があります。
ほとんどの人が400万円くらいしかもらっていないのに、一部の人が3000万円ほどの年収をもらっている業界の場合、平均年収と現実の年収のギャップが生じます。
そのため、年収の金額の多い層に着目する、中央値を見た方がよいと言われています。
「平均値」と「中央値」と「最頻値」の違い
平均値と中央値と最頻値の違いは以下の通りです。
- 平均値
全ての値を足して、全ての値の個数で割った数 - 中央値
全ての値を並べた時に中間に位置する値 - 最頻値
全体の値の中でもっとも同じ値が多い値
「最頻値」とは
最頻値は「全体の値の中でもっとも同じ値が多い値」のことです。
わかりにくいので、例をあげて説明します。
たとえば、「1、1、2、2、3、3、3、3、4、4、4、5、5」という値があったとします。
それぞれの値の数は以下のようになります。
- 1:2個
- 2:2個
- 3:4個
- 4:3個
- 5:2個
このように、もっとも多いのは3なので、3が最頻値になります。
最頻値は、極端の数があっても影響を受けない一方で、値が数多くないと算出できません。
「平均値」と「中央値」の違いのまとめ
以上、この記事では、平均値と中央値の違いについて解説しました。
- 平均値
全ての値を足して、全ての値の個数で割った数 - 中央値
全ての値を並べた時に中間に位置する値
平均値と中央値は似ているのでややこしいです。
しかし、意味と違いがわかれば、使い分けることも可能です。
ぜひ、この記事を参考にしてみてください。