昨日 統計の勉強13H
今日 統計の勉強 6H
少しずつやるよりも一気にまとめて勉強した方が早いと考え、
時間を集中投入しました。
数学は飽きがこないので、勉強時間を割くのはそこまで辛くなかったですね。
こんな感じで1項目ずつ見開きでノートをまとめました。
・相関係数
・箱ひげ図
一通り、統計の基礎を勉強してみて思ったこととしては、
明細書で統計に関する記述が出てきた場合は、
1.出てきた検定方法が何と何を比較していて、
2.どの部分を有意であるとみなすのか、
3.何故有意であるとみなすのか、
を理解できるように、自分の中で日日翻訳して読み進めるのが良いかなと思いました。
さらに追加で、
4.どの範囲を有意と定めるのか
まで理解できるとさらに良いです。
例えば、「Z検定」が出てくる以下の文章の場合、
As an additional example,
differential expression may also be determined by performing Z-testing,
i.e., calculating an absolute Z score,
as described herein and known in the art (see Example 1).
【US20150299808A1】
「Z検定により差次的発現を判定した」
と読むだけでなく、
1.標本の平均と母集団の平均とを比較して、
2.母集団の正規分布から外れている部分に標本の標準偏差がある場合を有意とする
3.外れている部分は母集団と比べて発現に差があると考えられるため有意である
※外れとする領域は場合によって異なります。
多くは、下図の両脇オレンジと青色の箇所のどれかです。
https://pro.arcgis.com/ja/pro-app/tool-reference/spatial-statistics/what-is-a-z-score-what-is-a-p-value.htm
と解釈し直すと、
状況がよりイメージできますし、
その後に出てくる色んな数値や範囲について何を指しているのかが分かってきます。
但し、3.は文章中から読み取ることができますが、
1.2.を理解するには、Z検定の基本的考え方が分かっていないといけないので、
明細書を読み込む前に勉強しておく必要があります。
上記1.~3.を理解したことによって、どんな風に読みやすくなるのかについて、
以下簡単に例を挙げてみます。
以下は、上の明細書の続きの文章です。
For example, as compared to a standard normal table (e.g., a control tissue),
at a 95% confidence interval (i.e., at the 5% significance level),
a Z-score with an absolute value greater than 1.96 indicates non-randomness.
この文章の重要な点としては、
「Zスコアの絶対値が1.96を超える場合を非ランダムとする」
これはすなわち、
4.Zスコアの絶対値が1.96を超える場合は有意である
と言うことです。
この時、Zスコアと言う単語を知らなくても、
1.~3.でZ検定が標本の平均と母集団の平均とを比較するものだ、
ということを抑えているので、
この一文を読んだ時に、
「Zスコアは母集団の平均値からのずれの境界を示す指標だろうな」
と言うことを予測しながら読むことができます。
訳す上での負担が減りますね。
場合によっては、統計に関する記述がかなり簡単に書かれている明細書もあるので、
ここまで意識して読む必要がないこともあると思いますが、
統計的根拠をしっかり示した医薬品などに関する明細書を訳す際には、
検定方法について上記4つの事項を意識しながら読み進めることで、
誤訳や違和感のある訳を作成することが無いようにしたいものです。
まだまだ統計に関する勉強は足りないですが、基礎は押さえられたので
これからも少しずつ勉強を進めていきたいです。
【参考】
統計WEB
https://kyoto-edu.sakura.ne.jp/ryukoku/?&year=2017&period=second&id=thu04&course=statistics&content=z-test
コメントを残す