研究 統計 臨床検査

【統計学入門】度数分布表ってなに?【臨床検査】【研究】

 

こんばんは、オダシです。

普段は大学病院の臨床検査技師、医療系大学院生をやりながら、

医療系のトピックや臨床検査、病理・細胞診、研究について書いています。

 

中国国内では新型コロナの影響も落ち着き、物流が回復しつつあるそうですね。

一方で、感染の中心はヨーロッパへ移行し、アメリカのダウ平均は、3回目のサーキットブレーカーが発動しました。

一気に不況へと突入している感じですね。

 

前回(データの尺度水準)に引き続き、統計学について書いていきます。

 

研究にどのような尺度水準を使うとしても、

データから特徴を抽出し、効率的に整理・要約することが、

データ解析の出発点になります。

 

これには、

  1. 表やグラフ、図によって整理・要約する方法
  2. 数値によって整理・要約する方法

があります。

 

一つの変量データの要約として基本的なものは、

度数分布表とヒストグラムがあります。

 

今回は度数分布表を解説していきます。

(ヒストグラムの解説は後日更新していきます)

 

度数分布表ってなに?

いきなりきかれても、わからないですよね。

解説のために、具体例を出します。

 

度数分布表の具体例紹介

この表.1は令和元年度の全国の最低賃金を集めた表です。

(出典は厚生労働省です)

表.1 全国の最低賃金

 

正直この表.1を見ただけでは、このデータの特徴はつかめません。

「なんとなく関東が高いんだなぁ」くらいです。

 

では、このデータを整理・要約した度数分布表を作ってみましょう。

作成した度数分布表を表.2として示します。

 

 

表.2 全国の最低賃金の度数分布表

 

これを見れば、いろいろな情報がすぐにわかります。

たとえば、

・最低賃金が750円から800円の都道府県がもっとも多い

・最低賃金が1000円を超える都道府県は2つしかない

・都道府県の78%で最低賃金が850円以下

といったことがわかります。

 

度数分布表の用語説明

階級値は階級を代表する値で階級の中間の値が使われます。

 

データの数値の大きさに応じて、いくつかの階級に分類したときに、

その階級にあるデータの個数を度数と定義します。

度数の総和はデータの個数と同じになります。

階級と度数を組み合わせて、対応させたものが度数分布です。

 

相対度数は、各階級の度数が全データ数に占める割合を表します。

相対度数の総和は1になります。

 

累積度数は、その階級までの度数の累積値です。

 

今回は、特に解説はしませんが、度数が最大となる階級の階級値を最頻値(モード)といいます。

 

 

まとめ

今回は度数分布表についてまとめました。

おさらいします。

・一つのデータの要約法には度数分布表ヒストグラムがある

・使う用語として階級値階級度数度数分布相対度数累積度数を知っておこう。

 

この記事が良かったらいいね!お願いします。

 

1

こんばんは、オダシ(@OdaCM_T)です。 普段は大学病院の臨床検査技師、医療系の大学院生をやりながら、医療系トピックや臨床検査、病理・細胞診、研究について書いています。 4月に入り、新年度が始まり ...

2

こんにちは、オダシです。 普段は大学病院の臨床検査技師、細胞検査士、医療系大学院生(D2)をしながら、医療系トピックや臨床検査、病理・細胞診、研究について書いています。   私は臨床検査技師 ...

-研究, 統計, 臨床検査

Copyright© OdaCM. T Blog , 2022 All Rights Reserved Powered by AFFINGER5.