こんばんは、オダシです。
普段は大学病院の臨床検査技師、医療系の大学院生をやりながら、
医療系のトピックや臨床検査、病理・細胞診、研究について書いています。
先日、首相の会見で、新型コロナに対して「非常事態宣言」が可能になりましたね。
小中高生の休校は未だ継続中のようですね。春の選抜も史上初の中止となりました。
そんな世間の情勢にありながら、所属研究室では、学部生が研究用のリサーチ会に向けて、研究を連日やっています。
はたから見たらスーパーブラックですね。
そんな彼らの中には、実験がほとんど終わった猛者もいるんですよね。
過去に記事でも少し触れましたが、研究ではデータをまとめ、自分なりに分析する必要があります。
つまり研究には、「統計学」の理解が欠かせないのですが、
大学の講義レベルの統計学は、正直あまり役に立たないんですよね。(うちの大学だけかもしれないですが…)
教えている教授もやる気がないし、講義自体も教授が書いたわかりにくい教科書を使って、ひたすらコピーするみたいな感じです。
そんなんじゃ、統計学の本質が隠れてしまします。
結果、卒研の終盤で切羽詰まり、院生にやり方だけ聞いて、やっつけで形だけデータを分析するなんてことになります。
毎年同じこと、数人に聞かれるのです。
「結局、統計学って何するんですか?」
「どうして、検査の研究に統計が必要なんですか?」
といった感じです。
毎回教えていると、つまづくポイントが似ていることに気が付きました。
…大体みんな基礎のはじめで詰まってるな
…じゃあ、今のうちに基礎を理解してもらおう
…そうすれば、まとめの段階での苦労は減るはず
と感じたので、
今回は、統計学入門として統計学の役割について書いていこうと思います。(次々と更新していきます。)
目次
統計学って何するの?統計学の4つの役割
私が学生に聞かれるポイントの一番ってここなんですよね。
学生みんなまじめだし、養成課程を選ぶくらいなので熱意は伝わってくるんですよね。
単純に、触れてこなかったものをいきなり使えって言われて、困っているだけなんですよ。(私が思うところでは…)
練習しないとチャリに乗れないようなもんです。
基本的なポイントを押さえれば、上手くいきます。
統計学の役割は大きく分けて4つです。
- 概念を定量化する
- 結果を予測する
- 仮説を検証する
- データを分類する
抽象的ですね。
それぞれ例を出して解説していきます。
1.概念を定量化する
「感染症の深刻さ」を客観的に評価するときに、どのように評価するでしょうか。
評価項目は様々です。
評価項目の一面として
- 患者数
- 死亡者数
- 感染地域の広さ
などがありますね。
「感染症の深刻さ」は抽象的ですが、
その一面である、「患者数」「死亡者数」「感染症地域の広さ」は数値化することが可能で、客観性があります。
客観性を保ったまま、概念を定量化することが統計学の一つの役割です。
注意点としては、データと数値化された項目の間には、完全な対応はありません。
野球選手やサッカー選手の能力を、「打率」や「シュート決定率」だけで評価することはないですよね。
「足の速さ」や「身長」、「体重」などの項目を合わせて評価することが大事です。
2.結果を予測する
研究やビジネスでは、データをもとに未確定(例えば未来)の結果を予測することが求められます。
例えば、A~Jの学生10人の身長と体重を測定したとします。
するとデータが得られます。
この結果をグラフ(正確には散布図)にまとめます。
ここに身長1.9mのKが来たら、Kの体重は大体予想できるということです。
具体的には、y=95.893x-96.663 の数式にx=1.90を代入します。
すると95.893×1.90-96.663=85.5(kg) (有効数字については後日書きます)
となり、Kの体重は85.5(kg)前後だろうと予測できます。
このような分析方法は回帰分析と呼ばれます。
未確定のものを既存のデータから、結果を予測することが統計学の一つの役割です。
3.仮説を検証する
コイントスをして、表なら100円もらえて、裏なら100円あげるゲームを相手から提案されました。
何連敗したら、いかさまだと思いますか?
人によると思いますが、統計学的には答えが出ています。
勝率が5%未満や1%未満の時です(検定時の縛りの強さによって変わります)
このとき、いかさまを疑う基準となるものがp値と呼ばれるものです(後日解説します)
基準をもとに、二つある仮説(今回はいかさまか、そうでないか)の片方を選び、残りを否定することで、
意味のある差(有意差)として仮説を検証します。
自身がたてた、仮説を検証することが統計学の一つの役割です。
4.データを分類する
これは中々、例を挙げづらいのですが、あえて挙げるとすれば、研究室やゼミの配属を決めるときですかね。
学年全体の希望を通すことは難しいので、学生個人をグループ分けする必要があります。
血液研究室の定員が埋まったときに、第一希望が血液研究室の学生に対して、どの研究室を再提案するか選択に迫られます。
このときは、血液研究室と似た研究室を提案する必要があります。
データ(学生の希望研究室)を属性ごと(それぞれの研究室)に適切に分類することになります。
集めたデータを分類することが統計学の一つの役割です。
まとめ
今回は、統計学の4つの役割についてまとめました。
おさらいします。
統計学の4つの役割は
- 概念を定量化する
- 結果を予測する
- 仮説を検証する
- データを分類する
です。
今回の記事が良かったらいいね!お願いします。