こんばんは、オダシです。
普段は大学病院の臨床検査技師、医療系大学院生をやりながら、
医療系トピックや臨床検査、病理・細胞診、研究について書いています。
新型コロナの影響かNYダウが3000ドル近く下落し、
日経平均も17000円を割るところまで来ましたね。
数年に一度の下落ですね。
医療職は病院で働く意識が強いのか、経済の勉強をしていないをしていない人がほかの業種に比べて多いように思いますね。
まあその辺の話は、私もこの相場を経験して、勉強中なので景気が落ち着いたころにかければいいかなと思います。
最近の話題はここら辺にしましょう。
前回は、統計学で使われる度数分布表についてまとめました。
今回は、度数分布表と並んでよく使うヒストグラムについて書いていきます。
ヒストグラムってなに?
前回は度数分布表について学びました。
今回まとめていくヒストグラムは、この度数分布表をグラフで表したものです。
とっつきやすくなりますかね。
さっそく解説していきます。
ヒストグラムの例
はじめに、具体例として、
前回も使ったデータ(全国の最低賃金、出典:厚生労働省)を表.1に出します
表.1 全国の最低賃金
前回でも出しましたが、生のデータは扱いにくいことがあるので、
データを整理、要約します。
前回は度数分布表を使いましたが、今回はヒストグラムにしていきます。
この表.1のデータをヒストグラムにまとめると、表.2になります。
表.2 全国の最低賃金のヒストグラム
一気にわかりやすくなった気がしませんか?
ヒストグラムにまとめることで、データの分布を視覚的に把握することができます。
例えば、
- 一番割合が多いのは775円の階級
- 左の二つの階級で、全体の70%以上を占める
といった感じです。
ヒストグラムをかけたら、次は分析するときのポイントを理解しましょう。
ヒストグラムを見るときの5つのポイント
ヒストグラムを見るときには、これだけはしっかりと確認してください。
- 度数のピーク(峰)の数が1つかそれ以上か
- 度数のピーク(峰)の位置(最頻値)
- 度数の散らばり具合
- 歪みなどのヒストグラムの形状
- 外れ値の有無
この5つのポイントは分野によらず、ヒストグラムを作成したときには重要です。
今回の例を使っていきます。
- 度数のピーク(峰)の数が1つかそれ以上か:一つ(単峰)
- 度数のピーク(峰)の位置(最頻値):775円
- 度数の散らばり具合:おおよそ階級値の上昇にしたがって、度数は減少する
- 歪みなどのヒストグラムの形状:右側のすそ野が伸びている(右に歪んでいる)
- 外れ値の有無:外れ値はない
といった感じでしょうか。
上に出した5つのポイントは、ヒストグラムを分析するときに有用です。
まとめ:ヒストグラムってなに?
今回は、統計学のデータ解析に欠かせないヒストグラムについてまとめました。
おさらいします。
・度数分布表とヒストグラムが持つデータは同じ、まとめ方が異なる
・ヒストグラムを見るときの5つのポイントは
- 度数のピーク(峰)の数が1つかそれ以上か
- 度数のピーク(峰)の位置(最頻値)
- 度数の散らばり具合
- 歪みなどのヒストグラムの形状
- 外れ値の有無
この記事が良かったらいいね!お願いします。