こんばんは、オダシです。
普段は大学病院の臨床検査技師、医療系大学院生をやりながら、
医療系のトピックや臨床検査、病理・細胞診、研究について書いています。
中国国内では新型コロナの影響も落ち着き、物流が回復しつつあるそうですね。
一方で、感染の中心はヨーロッパへ移行し、アメリカのダウ平均は、3回目のサーキットブレーカーが発動しました。
一気に不況へと突入している感じですね。
前回(データの尺度水準)に引き続き、統計学について書いていきます。
研究にどのような尺度水準を使うとしても、
データから特徴を抽出し、効率的に整理・要約することが、
データ解析の出発点になります。
これには、
- 表やグラフ、図によって整理・要約する方法
- 数値によって整理・要約する方法
があります。
一つの変量データの要約として基本的なものは、
度数分布表とヒストグラムがあります。
今回は度数分布表を解説していきます。
(ヒストグラムの解説は後日更新していきます)
目次
度数分布表ってなに?
いきなりきかれても、わからないですよね。
解説のために、具体例を出します。
度数分布表の具体例紹介
この表.1は令和元年度の全国の最低賃金を集めた表です。
(出典は厚生労働省です)
表.1 全国の最低賃金
正直この表.1を見ただけでは、このデータの特徴はつかめません。
「なんとなく関東が高いんだなぁ」くらいです。
では、このデータを整理・要約した度数分布表を作ってみましょう。
作成した度数分布表を表.2として示します。
表.2 全国の最低賃金の度数分布表
これを見れば、いろいろな情報がすぐにわかります。
たとえば、
・最低賃金が750円から800円の都道府県がもっとも多い
・最低賃金が1000円を超える都道府県は2つしかない
・都道府県の78%で最低賃金が850円以下
といったことがわかります。
度数分布表の用語説明
階級値は階級を代表する値で階級の中間の値が使われます。
データの数値の大きさに応じて、いくつかの階級に分類したときに、
その階級にあるデータの個数を度数と定義します。
度数の総和はデータの個数と同じになります。
階級と度数を組み合わせて、対応させたものが度数分布です。
相対度数は、各階級の度数が全データ数に占める割合を表します。
相対度数の総和は1になります。
累積度数は、その階級までの度数の累積値です。
今回は、特に解説はしませんが、度数が最大となる階級の階級値を最頻値(モード)といいます。
まとめ
今回は度数分布表についてまとめました。
おさらいします。
・一つのデータの要約法には度数分布表とヒストグラムがある
・使う用語として階級値、階級、度数、度数分布、相対度数、累積度数を知っておこう。
この記事が良かったらいいね!お願いします。