無作為抽出

ランダムサンプリング(random sampling、無作為抽出)とは、調査対象をある母集団(調査対象の全体)からランダム(無作為)に標本抽出(サンプリング)する行為のことである。日本工業規格では、無作為標本の項で、無作為な選択方法によって選んだ標本と定義している。母集団がわからない状態で、抽出方法が無作為であることを事前に保証する方法はありえない。

解説

ランダムサンプリングは推測統計学の数学的な研究から、全体のごく一部を調べるだけで、大きな母集団の正確な情報がつかめるという事が、実験的にも理論的にも証明されている​​。様々な調査の基本になっているとの主張があるが、必ずしも無作為性を検証できていない。例えば、無作為に3000人程度を調べるても、日本人1億3千万人の男女比も正確に分かるとは限らない。男女差の地域的な分布などは事前にわかっているため、特定の方法で調査した結果が近いために分かると主張しているにすぎない。事前に分かっていることに基づいて、無作為さを主張するのは本末転倒である。あくまでも、無作為に近い抽出方法であるとの主張が妥当である。社会調査では、無作為であることはほぼ不可能だとの仮説を置いて検討する方がよい。

ランダムサンプリングによる標本調査は、しばしば全数調査にかわって行なわれるが、これは主として、下記の理由による。
 

  1. 全数調査の実施が困難、又はコストやスケジュールが成果に対して過大と見積もられる。
  2. ランダムサンプリングを行なえば、標本調査の結果から、標本を抜き出すもとの集団(=母集団)における有益な情報(平均値や比率など)が推定出来る。
  3. この母集団の推定値(=母数)は、確率サンプリングが行なわれていれば、統計学の知識から、その誤差の大きさを見積もる事が出来る。

推測統計学を創始したとされるR.A.フィッシャーは、イギリスの農事試験所に14年間勤め、この時期に分散分析法を完成させた。差の有無などの検証にもランダムサンプリングが理論的前提となった様々な手法が使われる。無作為抽出の主な方法としては、単純無作為抽出法、系統抽出法、層化抽出法、確率比例抽出法、多段抽出法などがある。

事例

例えば、ある小学校の生徒全員にコインを投げてもらい(ランダム)、表の人だけを調査対象にする(サンプリング)という標本抽出は、ランダムサンプリングの一形態である。無作為とは、人為的な制約を設けず、まったくの偶然によって決める事で、サイコロの目などが該当する。しかし、この場合、調査対象を半分にすることが、全数調査よりもよいという仮説が妥当でなければ、数を減らすという作為しか残らない。例えば、対象を絞るため、サイコロ2つを投げて、合計が2の人だけを対象に面談するというのであれば、3%程度に絞り込めるため、調査時間を大幅に削減できる。しかし、1が2つ揃った目が幸運だという文化があったとすると、この抽出は幸運な人を作為的に選んだという評価をされる可能性がある。このように、社会調査の場合には、一見無作為なように見える場合も、その抽出方法がどのような文化、どのような情報に基づいて考案したかで無作為性を主張することは困難である。

ランダムサンプリングの難しさ

完全な無作為調査は費用や現実性から難しい場合も多い。特に対象の全体(母集団)を自由に選択するリストを手に入れるのは困難である。その結果、次善の方法としてやRDD法(Random Digit Dialing)など様々な実施方法が完全なランダムサンプリングの代わりとして実用されている。

ランダムサンプリングと見なせない例

インターネットのモニターによる市場調査は、調査対象とする母集団からのランダムサンプリングとは、明らかにみなせないので、母集団への適用は困難である。例えば、インターネットによる自発記入のアンケートの場合、1)インターネットを利用できる環境にある人、2)アンケートに関心を示した人、のようにサンプル自体に偏りが生じる。この種の調査は高感度調査と呼ばれる事もある。無作為抽出に基づく調査とは目的が異なっており、また、調査結果も大きく異なったものになる場合がある。

参考文献

  • }}

関連項目

Category:数学に関する記事

wikipediaより

このキーワードに関連するベストプラクティス

詳細検索:条件をk選択して検索できます。

google地図から検索:Google Mapから検索できます。 google画像から検索:事例ごとの画像で検索できます。
環境首都コンテスト全国ネットワーク
辞令を動画でみる:公益財団法人ハイライフ研究所