ランダム サンプリング。 サンプリング 現代日本語書き言葉均衡コーパス(BCCWJ)

内部監査部門におけるサンプリング

ランダム サンプリング

属性サンプリングとは、監査対象部門の内部統制が有効に機能しているかを判断する為に監査手続きを実施する際に利用される。 サンプル結果を評価する際、監査人は母集団の属性からの逸脱率(内部統制が有効に機能していない比率)が、監査人が許容する逸脱率を上回っているかに関心を持つ。 監査対象部門において、請求書が有効な出荷指示書によって裏付けられていることを立証するためにサンプリングを実施する。 仮に、許容できるサンプリング・リスク、許容逸脱率、予想逸脱率を以下の値とする。 許容できるサンプリング・リスク・・・5%• 許容逸脱率・・・・・・・・・・・・・・・・・・・6%• 予想逸脱率・・・・・・・・・・・・・・・・・2. 5% サンプリングの目的及び母集団の確定 設例のサンプリング目的は、実在性に関わる内部統制が有効に機能しているかを評価することであり、監査期間中に作成されたすべての請求書が母集団となる。 サンプルサイズの確定 サンプルサイズとは、監査人が検証するサンプルの数である。 属性サンプリングでは、許容できるサンプリング・リスク、許容逸脱率、予想逸脱率、母集団という4項目を数値化し、サンプリング テーブルを使ってサンプルサイズを確定する。 設例の場合、サンプルサイズは150の請求書とする。 サンプルの抽出 抽出したサンプルがより母集団を代表するよう、作成時期、金額、請求書作成者、顧客等に偏りが請求書をサンプルとして含むことが望ましい。 サンプルの判定 設例の場合、サンプルサイズ150の内、8つの逸脱が発見された。 3% 設例の場合、許容逸脱率が6%で、サンプル逸脱率が5. 3%であるのだからアサーションに対する統制は理論上は有効に機能しているようにも見える。 しかし、実際はサンプリング・リスクを回避するために、サンプリングテーブルを使ってサンプル逸脱率をより慎重な数値へと調整を加える。 その結果算出される数値が逸脱率の上限である。 設例では9. 5%と計算される。 (算出方法は省略) サンプルの結果の評価 設例の場合、逸脱率の上限が9. 5%で許容逸脱率が6%である為に、統制のリスクは予想よりも高いことが判明し、統制の有効性が立証されなかったという結果になる。 変数サンプリング ー設例ー 監査対象部門では売掛金が300,000ドル計上されており、その売掛金は1,500の顧客口座により構成されている。 監査人は監査対象部門の売掛金の実在性を立証する上でサンプリング実施する。 仮に、許容できるサンプリングリスク、許容虚偽表示、予想虚偽表示を以下とする。 許容できるサンプリングリスク・・・10%• 許容虚偽表示金額・・・・・・・10,000ドル• 予想虚偽表示金・・・・・・・・・・・4,000ドル サンプリングの目的及び母集団の確定 設例のサンプリングの目的は、売掛金の実在性または発生に関る証拠の収集であり、母集団は、売掛金勘定残高の合計300,000ドルである。 サンプルサイズの確定 サンプルサイズとは、監査人が検証するサンプルの数である。 PPSサンプリングでは、許容できるサンプリング・リスク、許容虚偽表示、予想虚偽表示、母集団という4項目を数値化してサンプルサイズを計算する。 設例の場合、サンプルサイズは174の顧客勘定とする。 (算出については省略) サンプルの抽出 サンプルの抽出には通常、系軸サンプリング法を用いる。 次に顧客の売掛金残高をランダムに並べ採番し、ランダムに選んだ金額(300ドル)でスタートし、サンプル間隔が1,724だった場合、1番から300ドルに到達した口座をサンプルとして抽出し、次は1,724ドルを加えた金額のチタンを含む胃口座がサンプルとして抽出される。 サンプルの判定 抽出されたサンプルに対して、確認状を送付した所、3つの口座で虚偽の表示が発見された場合、サンプル中の差異は2,125ドルだった。 サンプルの判定に基づき、サンプリングリスクを回避するために、発見された虚偽表示金額(2,125ドル)をより慎重な数値へと調整を加える。 その結果算出される数値の虚偽表示金額の上限である。 設例では、6,695. 48ドルと計算される。 (算出は省略) サンプルの結果の評価 虚偽表示金額の上限(6,695. 48ドル)が、許容する虚偽表示金額(10,000ドル)を下回っている為、母集団は許容額を超える虚偽表示金額は含まないということを裏付けたことになり、勘定残高は公正に記録されていると結論付けられる。 サンプリングサイズの確定 サンプルサイズとは、監査人が検証するサンプルの数である。 属性サンプリングでは、許容できるサンプリング・リスク、許容逸脱率、予想逸脱率、母集団という4項目を数値化し、サンプリングデータを使ってサンプルサイズを確定する。 変数サンプリングでは、許容できるサンプリング・リスク、許容虚偽表記、予想虚偽表示、母集団という4項目を数値化してサンプルサイズを計算する。 サンプリングリスク サンプリングリスクとは、サンプルを検証した場合の結論と、母集団すべてを検証した場合の結論とが異なるかもしれない、というリスクである。 言い換えれば抽出したサンプルが、母集団全体の特徴を反映していない可能性を指していることである。 過誤棄却のリスク 監査におけるサンプリングリスクには2種類がある。 1種類は過誤棄却のリスクである。 属性サンプリングにおける過誤棄却のリスクとは、サンプルに基づいた統制リスクの評価レベルを、実際に内部統制の有効性よりも高く評価してしまうというリスクである監査人が統制リスクを高く評価しすぎた場合、更なる監査手続きを必要以上に実施する為、監査の効率は下がる。 変数サンプリングにおける過誤棄却のリスクとは、実際には記録された勘定残高には重要な虚偽の表示が含まれていないにも関わらず、重要な虚偽の表示が含まれていると結論付けた場合、追加的手続が実施される為、通常は正しい結論へと導かれる。 ただし、監査の効率は下がる。 過誤採択のリスク 監査におけるサンプリングリスクのもう一つは、過誤採択のリスクである。 属性サンプリングにおける過誤採択のリスクとは、サンプルに基づいた統制リスクの評価レベルを、実際の内部統制の有効性よりも低く評価してしまうというリスクである。 監査人が統制リスクを低く評価しすぎた場合、更なる監査手続きは監査を有効とするのに必要なレベルまで実施されない。 つまり、監査の有効性に影響を与える。 変数サンプリングにおける過誤採択のリスクとは、実際には記録された勘定残高には重要な虚偽の表示が含まれているにもかかわらず、重要な虚偽の表示は含まれていないという結論をサンプルが支持してしまうリスクである。 勘定残高に重要な虚偽の表示が含まれていないと結論付けた場合、追加的手続は実施されない為、財務諸表には虚偽の表示が含まれることがある。 つまり、監査の有効性に影響を与える。 特殊な属性サンプリング 連続サンプリング 連続サンプリング(ストップ・アンド・ゴー・サンプリング)は予想逸脱率が許容逸脱率よりも相対的に低い場合に利用される。 一般的に監査人が逸脱が少なく信頼性のある母集団に対し、出来るだけ楽にサンプリングを実施したい時に適用される。 仮に母集団20,000に対して5%未満の逸脱率であれば、十分な補償が得られると考えられる。 50のサンプルに対して、逸脱が発見されなかった場合、母集団が含む逸脱率が5%未満である確率は92. この結果に満足であった場合、これ以上の連続サンプリングを実施しない。 50のサンプルに対して、一つの逸脱が発見された場合、母集団が含む逸脱率が5%未満である確率は72. 06%であると読む。 この結果に満足できない場合は、100までサンプル数を増加して統制のテストを実施する。 100のサンプルに対して、追加の逸脱が発見されなかった場合、母集団が含む逸脱率は5%未満である確率は96. Jこの結果に満足であった場合、これ以上のサンプリングを実施しない。 サンプル結果が結論を出せるような証拠を提供しない場合は、サンプルサイズを増やしながら繰り返し検証を行う。 このように、連続サンプリングでは、伝統的な属性サンプリングよりも少ないサンプルサイズでより効率的にサンプリングが実施できる。 発見サンプリング 発見サンプリングは、予想逸脱率は低いが、逸脱があると極めて深刻な場合に利用され、少なくとも1つの逸脱を発見するようにサンプル数を決定する方法である。 監査人は母集団全体に対して意見を表明するのではなく、特徴を持ったサンプルを少なくとも一つ発見することを目指す。 発見サンプリングは、二重支払、不正出荷、架空の従業員に対する給与支払い等を発見する際に利用される。 すなわち、発見サンプリングは不正の存在を疑っているときに使われる。 上記発見サンプリング表では、10,000の母集団の中に50逸脱があると推定される場合、600のサンプル数をテストする。 その中に少なくとも1つの逸脱が発見される可能性gは95. 5%あると読む。 古典的変数サンプリング ー設問ー 10,000口座から構成される母集団を想定し、記録金額の合計を1,000,000ドルとする。 従って、平均簿価は100ドルとなる。 抽出されたサンプル中の平均記録金額を101ドル、サンプル中の平均監査金額を98土塁とする。 (1)平均推定見積法 平均推定見積法では、サンプル中の平均監査金額に母集団の数をかけることによって監査金額を推定する。

次の

色々あるサンプリング方法の種類(ランダム、多段、層別、集落、系統)

ランダム サンプリング

サンプリングについて サンプリングとは、標本抽出のことであり、研究の調査対象を選ぶために行われる手続きのことをいう。 臨床心理学の研究では、特定の個人の心理や行動に焦点を当てた事例研究が行われることがある。 一方、人間化学は、人間の反応を縦断的かつ,横断的に調査し,そこで得られたデータに基づき、普遍的ないし,一般的な反応を捉えようとする学問である。 そのため、ある研究を試みようとする際,その対象となる母集団に,調査や 実験を試みようとすることはまずない。 なぜなら,母集団が大きくなればなるほど、収集べきデータは膨大になり,必然的に,時間や労力,費用も膨れあがるからである。 そこで、母集団の一部である標本を調査することによって、標本が有する特徴から母集団の特徴へと一般化する方法を講じることになる。 その際に、適切なサンプリングが求められるが、それが、 ランダムサンプリング(無作為抽出)というわけだ。 ランダムサンプリング(無作為抽出)とは ランダムサンプリング(無作為抽出)とは、母集団のどの要素も等しく、偏りのない確率で抽出される方法を意味する。 例えば、1から6の数字が書かれたカードの中から3枚選ぶとする。 これをAさんが1枚ずつ順に選定するとなると、これは無作為抽出とは言えない。 よって、これを無作為抽出とするためには、6面サイコロを使い一枚ずつカードを選ぶなどの方法を施す必要がある。 非確率抽出法 ただ、心理学研究では、現実問題このような確率論に基づいて抽出を行うことが困難な場合があり、そのような時は、非確率抽出法を用いることがある。 その名の通り、確率論に基づかない方法である。 その一つに、接触しやすい人を標本とする便宜的抽出法というものがあるが、たとえば、街灯で街ゆく人に手当たり次第調査を依頼する方法がこれに当たる。 しかしながら、このような非確率抽出法には、母集団を推測することについての科学的根拠は一切ない。 したがって、その限界をよく理解し、研究の目的ないし課題をよく見極め、それでも意義があると考えられる場合に、非確率抽出法を用いるのが望ましいと言える。 例えば、「専業主婦に対する態度」というテーマで街灯調査を行ったとしても、そもそも既婚か否かや、年収によってその意見は大きく頃なることが予測される。 そのため、この様な場合は、非確率抽出法を用いて結果を一般化することは不適切と言わざるを得ない。 そこで、「独身者からみた専業主婦」の様に、結果の範囲を限定するなどの措置が必要である。

次の

エクセルRAND関数で乱数をつくり、ランダム(無作為)に標本を抽出する方法

ランダム サンプリング

割りばしで自作した抽選機。 精度の低い抽選機を使うと、無作為性が低い抽出となる その名の通り、ある集団から要素を抽出するのに、作為的な手順を使わないことが特徴である。 そのため、無作為抽出法によるサンプリングを行うと、集団の全ての要素が同じ確率で抽出されることになる。 標本調査における標本の抽出法には、全体から無作為に抽出する「無作為抽出」の他に、全体から作為的に抽出する「有意抽出」がある。 例えばクラスの掃除当番を選ぶ場合、「出席簿からくじで無作為に抽出した出席番号の生徒を掃除当番に任命する」のが無作為抽出で、「先生が気に入った奴を掃除当番に任命する」のが有意抽出である。 無作為抽出の方が客観的な公平性が担保でき、「段ボールで自作したルーレット」や「印刷に失敗したプリント用紙の裏紙で自作した抽選箱」など割と簡単に道具を作れるので、民間でも割とカジュアルに行われている。 仮に「無作為抽出」と称していても、客観的な無作為性が担保できない場合、例えば「出席簿でたまたま目についた奴を何名か無作為に掃除当番に任命する」などは、先生が気に入った奴を有意抽出している可能性が客観的に排除できないので、無作為抽出ではない。 調査にも使われる。 「割りばしで自作したので特定の番号の物がいつもささくれで引っかかる抽選機」などの精度の低い乱数発生器を使用したことによる無作為性(ランダムネス)の低さは、「掃除当番を選ぶ」などの場合は単に「クジ運が悪い」として我慢してもらえば問題にならないものの(それでも限度があり、あまり悪いと有意抽出と同様にクジ運ではなく先生が恨まれることになる)、統計調査などの学術的調査では標本誤差の元となるので、問題となる。 「有意抽出」や、「無作為性の低い無作為抽出」では、正確な統計調査にならない。 なので、統計調査として行われる標本調査では、有意抽出ではなく、かならず無作為抽出が使われる。 また、人力で調査を行うことによるコストや労力との兼ね合いを取りながら、なるべく無作為性が高くなるように様々な手法が工夫されている。 工業製品の「抜き取り検査」でも、無作為性が低いと不良品の率が正確に解らず、自社検査にパスしたのに出荷先の検査で段ボールの底の方から不良品が大量に見つかって会社の信用がピンチになるので、たとえコストがかかっても無作為性を確保することは重要である。 特に、倉庫や段ボールの奥の方に積まれたものを検査するのがマンパワー的に難しく、完全な無作為抽出をせずに上の方だけ適当に検査する事があるので、製品全体の無作為抽出が楽にできるような工夫が必要である。 カードゲームなどのテーブルゲームでも、無作為抽出であることは重要である。 ゲームで無作為抽出のように見せかけて自分の欲しい手札を引く「」と言うテクニックがある。 アナログのゲームにおける無作為抽出は、コンピューターゲームとは違ってコンピューターを使った無作為抽出を行わず、全て人力で行うことが特徴なので、その分イカサマがしやすいが、絶対に行ってはいけない。 手品でも、タネも仕掛けもない無作為抽出であることが強調されるが、実はタネも仕掛けも仕込まれているので無作為抽出ではない。 無作為抽出の手法 [ ] 乱数生成器(ランダマイザー) [ ] ランダマイザーと標本抽出枠(豊川稲荷のおみくじ) 直接、ある集団の全ての要素を無作為に配列(ランダマイズ)し、そこから任意の要素を抽出する方法と、まず、ある集団の全ての要素で構成される任意の配列のリスト(標本抽出枠)を作り、標本抽出枠のそれぞれの要素に連番を振り、乱数生成器(ランダマイザー)で無作為な乱数を生成し、出て来た乱数と同じ番号が振られた要素を標本として標本抽出枠から抽出する方法がある。 例えばトランプや抽選機では、ランダマイズされたものから任意のカードやボールを引くことによって無作為抽出が行われる。 トランプでは、抽選機では回転(俗にガラガラと言う)によってランダマイズが行われる。 一方、統計調査などで、人間を無作為抽出する場合は、複数人の人間をまとめてシャッフルできる巨大生物でもない限り、まず調査対象となったある集団(母集団)の全ての人間がリストアップされて連番が降られた標本抽出枠を作って、そこから乱数発生器で乱数を生成して要素を無作為に選んで抽出する方法が使われる。 コンピューターやサイコロなど、要素を無作為に配列したり乱数を発生させたりする装置のことを 乱数生成器( ランダマイザー)と言う。 カードやボールを人間が自分の手で直接ランダマイズして抽出する場合もあるが、カードやボールをランダマイズせずにあくまで標本抽出枠として使い、サイコロやルーレットなどのランダマイザーで生成した数字をもとに抽出することも多い。 やでプレーヤーや次のアクションなどを無作為抽出する場合は、ランダマイザーとして「多面ダイス」と言う特殊なサイコロが使われることがある。 身近なランダマイザーとしてはがあり、ボードゲームではかなり使われるが、「0(表)」と「1(裏)」しか生成できないので、標本調査や抜き取り検査では普通は使わない。 標本調査や抜き取り検査での無作為抽出におけるランダマイズはコンピューターを使うのが普通だが、コンピューターを使わないボードゲームではアナログのランダマイザーを使うのが普通である。 現代では100円ショップでランダマイザー(ダイス、サイコロ、ルーレットなど)が購入できるほか、ホビーショップでもテーブルトークRPG用の様々な多面ダイスが安価に購入できる。 抽選機やなど、「ランダマイザー」が無作為抽出におけるランダマイズから抽出までの一連の作業を同時に行ってくれる場合もある。 非復元抽出と復元抽出 [ ] 無作為抽出を何度か繰り返して行う場合、既に抽出された要素を母集団から除外して無作為抽出を行う「非復元抽出」と、抽出された要素を除外せずに再び母集団に戻して無作為抽出を行う「復元抽出」がある。 例えばクラスの生徒から掃除当番を決める無作為抽出において「復元抽出」を行った場合、同じ人が何度も繰り返して掃除当番に選ばれる可能性が有り、不都合が生じるので、なるべく「非復元抽出」を行うことが望ましいが、例えばサイコロで無作為抽出を行う場合、既に出た出目が再び出る可能性を原理的に排除できないなど、「非復元抽出」を行うのが難しい場合がある。 また、母集団が非常に大きく、抽出される要素数が非常に少ない場合、同じ人が何度も繰り返して抽出される可能性は非常に小さいので、無視されることがあり、「復元抽出」がしばしば使われる。 統計調査における無作為抽出 [ ] 統計調査として行われる標本調査における無作為抽出とは、ある調査対象の全体()から対象となる標本を無作為に抽出する行為のことである。 の基本となる手法である。 統計調査には「標本調査」の他に、母集団の全数を調査する「全数調査」があるが、母集団が大きかった場合は全数を調査すると費用や手間なども大きくなるため、標本調査が行われる。 無作為抽出を行なえば、統計学の見地に照らし合わせて、標本調査の結果から母集団における平均値や比率などが推定出来る。 また、母集団からの無作為抽出は、完全に確率的に現れると言えるので、同じく統計学の見地に照らし合わせて、母集団の推定値(=)のの大きさを見積もる事が出来る。 を創始したとされるは、イギリスの農事試験所に14年間勤め、この時期に法を完成させた。 差の有無などの検証にも無作為抽出が理論的前提となった様々な手法が使われる。 統計調査における無作為抽出の手法 [ ] 統計調査における無作為抽出の手法は、母集団の全ての要素を対象として単純に無作為抽出を行う 単純無作為抽出が最も基本的な方法だが、標本抽出枠が大きかった場合は費用や手間なども大きくなるため、人間が人力で標本調査を行う上で、単純無作為抽出法を使うのは難しい場合も多い。 また、単純無作為抽出法では、隣り合った要素同士が選ばれたり、3個以上連続した要素が選ばれる可能性が有るため、例えば市内の高校生の代表を何名か無作為抽出する場合、ワルばかりいる高校の生徒を連続してサンプリングしてしまう可能性が有るなど、標本の精度が悪くなる(標本誤差が大きくなる)恐れがある。 そのため、「単純無作為抽出法」よりも手間や費用が少なくなるような、あるいは「単純無作為抽出法」よりも標本の精度が高くなる(標本誤差が少なくなる)ような、様々な手法が存在する。 主な方法としては、系統抽出法、層化抽出法、確率比例抽出法、多段抽出法などがある。 どのような方法を取っても、最終的に全ての要素で抽出される確率が同じなら、無作為抽出である。 逆に言うと、たとえ自分では無作為に抽出したつもりでも、最終的に各要素・層・クラスター(集団)ごとで抽出される確率にばらつきがあれば、それは無作為抽出ではない。 現実的な調査では、いくつかの無作為抽出法を組み合わせたり、無作為抽出による標本調査と全数調査を組み合わせて使われることも多い。 標本抽出枠と乱数の生成 [ ] 統計調査における無作為抽出の前提として、まず母集団から無作為抽出するための「標本抽出枠」(sampling frame)を用意する必要がある。 いわば母集団を代表する要素が記述された「リスト」が用意されていないと、そこから無作為抽出を行うことが出来ない。 既に用意されている場合もあり、例えば学校では標本抽出枠としてクラスのを使うことが出来る。 日本の世論調査では、標本抽出枠として自治体が制作したなどが用いられるが、もし標本抽出枠が無い場合は母集団の要素を自力でリストアップする。 現代ではコンピューターで電話番号の標本抽出枠を生成する Random Digit Dialing など様々な方法が実用化されている。 標本抽出枠から要素を無作為に抽出するには、まず標本抽出枠の全ての要素に通し番号を振り、そこから抽出する番号をで決める必要がある。 乱数の生成方法は、昔はやなどが使われた時代もあったが、現代では普通コンピューターのが使われる。 単純無作為抽出法 [ ] 12人の生徒の中から4人を単純に無作為にサンプリングする「単純無作為抽出法」のイメージ 単純無作為抽出とは、母集団の全ての要素を対象として無作為抽出する方法である。 無作為抽出の最も基本的な方法で、もっとも単純な方法である。 単純無作為抽出法以外では、「標本抽出枠に何らかの規則性がないか」とか「全校生徒の男子と女子の比率」などの様々な情報が必要になるのとは違い、単純無作為抽出法は「抽出枠」の情報さえあれば行うことが出来、抽出枠の大きさが小さい場合はこの手法を使うのが最も楽である。 しかし、抽出枠が大きい場合は非常に手間と時間がかかるので、「層化」や「多段抽出」を行った方が楽である。 系統抽出とは違い、隣り合った要素同士が選ばれたり、3個以上連続した要素が選ばれる可能性がある。 住民の意識調査などでは、同じ世帯の人は同じ意見を持つ可能性が高いので、同じ世帯から複数の人が抽出される可能性が有ることは、デメリットになる。 ただし、抽出枠が非常に大きい場合は、隣り合った要素同士が選ばれる可能性はほとんどないので、あまり気にされない。 系統抽出法 [ ] 先頭から「2人目」を開始点として、「3人」飛ばしにサンプリングする「系統抽出法」のイメージ 抽出枠の「先頭から m 番目」の要素を開始点として、そこから「 n つ飛ばし」に、要素をそれぞれサンプリングする方法( m, n はそれぞれ任意の数)。 開始点を作為的に選んだ場合は無作為抽出にならないが、開始点を無作為に選ぶので、全ての要素が同じ確率で選ばれる無作為抽出となる。 隣り合った要素がサンプリングされることが無いのが特徴。 「 n 番目」を機械的に選出するだけなので、乱数発生器が使えない場合、つまりコンピュータが使えない状況でも人力で行うことが出来る。 「3の倍数の時にアホが並んでいる名簿」から3つ飛ばしにサンプリングする場合など、標本抽出枠に何らかの規則性が有る場合、無作為抽出にならない欠点がある。 層化抽出法 [ ] 母集団をあらかじめいくつかのグループ(層)に分け、それぞれのグループで単純無作為抽出を行う「層化」と呼ばれる手法を用いる。 例えば世論調査では、都道府県別・自治体別などに分けてサンプリングする層化抽出法が行われている。 母集団の要素数が約1億2000万のデータを「抽出枠」として使って単純無作為抽出するよりも、層化した方が楽だし、都道府県別の世論も見られるメリットがある。 ただし、携帯電話のRDD方式の世論調査だと市外局番が使えない ので、コンピュータで制作した数億の抽出枠から機械の力で単純無作為抽出せざるをえない。 このように、「抽出枠」の情報に加えて「層化」を行うための情報がないと母集団を層化できないデメリットがある。 各層で分布が大きく異なる場合に効果を発揮する。 例えば、東京都(人口が約1300万人)から鳥取県(人口が約60万人、東京23区全体どころか練馬区や世田谷区よりも人口が少ない)まで、人口比が著しく異なる都道府県からなる日本列島からまんべんなく人間を無作為抽出する場合に、単純無作為抽出だと人口が少なくてサンプリングされない地方民が出る場合があるが、都道府県ごとに層化すると、そういうことがない。 都道府県別に分けてサンプリングしても、全ての日本国民でサンプリングされる確率が同じなら、無作為抽出である。 詳しく言うと、比例配分法(比例割当法)と最適配分法(最適割当法)がある。 比例配分法 [ ] 12人の生徒を「男子」「女子」「どちらでもない」で分け、それぞれの比率に合わせて最適な数をサンプリングする「比例配分法」のイメージ 層化抽出法の一種で、各層の大きさに比例させて標本数を配分する。 例えば学校では、全校生徒から単純無作為抽出するよりも、男子と女子の比率に合わせてサンプルを揃えた方が都合が良い場合、「男子」と「女子」と言う層の大きさに合わせて標本数を決める。 男子と女子で別々にサンプリングしても、男子と女子でサンプリングされる確率が同じならば、無作為抽出である。 あらかじめ全数調査するなどして、各層の比率が分かっていないと行えないという欠点がある。 最適配分法 [ ] 層化抽出法の一種で、各層の大きさに合わせて最適な標本数を配分する。 「ネイマン・ピアソン理論」(「」の基本となる理論)の確立者の一人でもあるが考え出したので「 ネイマン配分法」ともいう。 例えば、企業の生産高を見るとき、一定規模以上の大企業は全数調査し、一定規模以下の中小企業は単純無作為抽出によるサンプリング調査をして全体を推定する、と言う形で、各層に最適なサンプリング数を配分する。 クラスター抽出法 [ ] 12人の生徒を2人づつ6つのクラスターに分け、そこから2つのクラスター(合計4人)をサンプリングする「クラスター抽出法」のイメージ 母集団をいくつかのクラスターに分け、その中からいくつかのクラスターを無作為抽出し、それを全数調査する。 例えば、市内の高校生を高校ごとに分け、その中から3つの高校を無作為抽出し、その高校に通う高校生を全数調査する。 この例では、市内の全ての高校生において選ばれる可能性が同じであるため、無作為抽出である。 高校生の代表としてワルばかりいる高校の生徒を大量にサンプリングしてしまう可能性もあるなど、単純無作為抽出法などよりも代表性が低くなってしまうという欠点がある。 しかし市内の全ての高校に行って調査しなくていいのは楽であり、利点である。 多段抽出法 [ ] 母集団をいくつかのグループに分け、そこからランダムにグループを抽出する。 抽出されたグループの中からさらにランダムにグループを抽出…と言う作業を何度か繰り返し、何段階かに分けてサンプルを抽出する方法。 例えば、全国の高校生から500人をサンプリングする場合、全国の都道府県の中から10の都道府県を無作為抽出する。 抽出された都道府県ごとに10の高校を無作為抽出する。 抽出された高校ごとに5人を無作為抽出する、と言う形である。 つまり、単純無作為方式をして実行する。 全国の全ての高校生において選ばれる可能性が同じであるため、無作為抽出である。 クラスター抽出法と同じく、単純無作為抽出法などよりも代表性が低くなってしまうという欠点がある。 標本調査における無作為抽出と有意抽出の比較 [ ] 標本調査における標本抽出の方法としては、「無作為抽出」の他に「有意抽出」がある。 母集団を代表する標本を無作為に抽出したものを「無作為抽出」と呼ぶのに対して、母集団を代表する標本を有意に抽出したものを「有意抽出」と呼ぶ。 標本調査は全数調査とのズレ(誤差)が発生することが必ず避けられないが、無作為抽出法を用いた標本調査において発生する誤差(標本誤差)の範囲が確率論に基づいて統計学的に計算できるのに対し、有意抽出法を用いた標本調査において発生する誤差の範囲は確率論的に計算することが出来ず、不明となる。 のモニターによる(モニター調査)を例にすると、インターネットによる自発記入のを用いて標本を集めるので、非常に手軽にできるというメリットがある反面、1 インターネットを利用できる環境にある人、2 アンケートに関心を示した人、のようにサンプル自体にが生じる。 サンプル自体に偏りがあるため、このモニター調査の結果が全数調査の結果(真の値)とどの程度ずれているかの範囲は、統計学的に算出することが出来ず、客観的に信頼性が置けるデータがゲットできない、と言うのがデメリットである。 このため、例えば世論調査など客観的な信頼性が重視される統計調査では、いくら手軽にできても有意抽出法は使われず、面倒な手順を踏んでも必ず無作為抽出法が使われる。 関連項目 [ ]• - 、• 脚注 [ ] 注 [ ].

次の