統計基礎テスト 2003年春学期 統計の応用担当 坂東昌子
学籍番号( )名前(
)
1 次の括弧の中に適当な単語を入れなさい。
一般に統計解析において対象となる集団のことを、[1]という。[1]が何であるかを明確に規定することを[1]の特定化という。「ある病気の患者の集合」というだけでは、特定化が十分ではない。日本人の患者に限定するのか、男女の区別は設けないのか、年齢層の区別はどうするのか、どういう検査法によって病気かどうかを判別するのか、少なくともこれらの点が明確にされていなければならない。[1]の構成員すべてについて、しらみつぶしに調査することを[2]という。しかし、[2]は費用や時間がかかりすぎる。しかも、ものによっては、[2]が原理的に不可能な場合もある(質問1)。そこで、[1]からいくつか選んできて、それらについてだけ調査・測定をおこなう。この小集団のことを[3]という。[3]を選ぶときにはできるだけ偏りのないように抽出する必要があり、こういう抽出の仕方を[4]という。うまく抽出すれば、たいていの場合、[3]のヒストグラムを描くと、平均値あたりで山をもつ左右対称な形になる。ヒストグラムをスムーズにつなぐと、平均値を頂点とする釣鐘型のグラフになるのが普通である。この形の分布は[5]と呼ばれていて、統計処理に際して重要な情報を与えてくれる。分布の中心の値はデータの平均値できまり、幅(広がり)は[6]できまる。しかし、こうした方法を用いたとしても、なお分布に偏りが残ることがある。例えば愛知大学の学生の身長を調査するのに[4]の方法で抽出した[3]をとってきたのに、分布を調べると2つの山ができた。この原因は、[質問3]。で、こういうときには[質問3]とすればいい。このような抽出のことを層別抽出というが、こういう方法を最初に提案したのはフィシャーである。またあまりに少ない数の[3]では正しく[1]を反映できない。統計報告を示されたときに、その結論の信頼性がどの程度かを見分ける目をもっていないと、統計結果の「うそ」に騙されることになりかねない。
(1)次の括弧の中に適当な言葉を入れなさい。
[1] [2] [3] [4] [5] [6]
(2)質問2 どういう場合に不可能なのか具体的な例をあげて説明しなさい。
(3)質問3:2つの山が出来た原因を延べ、この場合はどう抽出すれば1つの山になりそうか考えてみよ。
2. 次の問題に答えなさい。
(1) 太郎と花子は2人とも愛知大学の学生である。定期試験で英語の成績が素点で発表された。太郎は60点、花子55点である。太郎のクラスの平均点は50点、標準偏差(SD)は20点であった。花子のクラスの平均点は40点で標準偏差は5点である。太郎は花子よりいい点だったのでホッとしている。さて、太郎はクラス内での順位と花子の順位を推定してみよ。但しどちらもクラスの人数は50人である。
(2) 知能指数(IQ)は、平均100、標準偏差20と定義されている。次の知能指数を偏差値ならびに標準量(平均0、標準偏差1となる量)になおしてみなさい。
110→(偏差値 標準量 )
80→(偏差値 標準量 )
(3) 「生殖技術の発展で精子バンクから知能指数の高い精子を選んでみんなが子どもを作るようになるとだんだんIQの高い人が増えてくるだろう」という意見は間違っています。どこが間違っているのか述べなさい。
3.今年は暑い日が続いて桃が豊作であった。中田君のふるさとでは、裏山から桃が1000個とれた。大中小とわけて売り出すことにした。そこで、サンプルとして10 個取り出したら、次のような重さであった。(注意:本当は10個ではデータとしては少ない。)
標本 18g, 22g, 21g, 19g,
17g, 19g, 24g, 20g, 20g, 20g
(1) 標本の範囲と分散ならびに標準偏差を出しなさい。計算の仕方も書くこと。
(2) 次の桃は、1000個のうち大きい方から勘定して何番目ぐらいか?
24g( 番目) 16g( 番目)
(3) 1000個のうち大は00個、小は200個としたい。何グラム以上を大、何グラム以上を小として振り分ければいいか?