Site Overlay

層別非系統的サンプリング

地図の作成にも応用される統計学上のデータサンプリング手法の一つに「層別非系統的サンプリング」というものがあります。統計学上調査対象全体を母集団と呼び、そのすべてに対してデータを取得する場合とサンプリング手法に従って一部のデータを収集する場合があります。サンプリングする場合注意しなければいけないのが、母集団の性質に見合った適正なサンプリング手法を選択すること。これを誤ると母集団を擬似的に代表しうるデータ取得とならなくなってしまうためです。冒頭の層別非系統的サンプリングという名称の「層別」とは、母集団の性質がある程度わかっていてサンプリングをいくつかの層(グループ)に分けて行うことができるという事が前提条件として必要となります。次に「非系統的」の系統とはサンプリングを一定の間隔をもって行うことであるため「非系統的」ということはそうでないサンプリングという事になりますから無作為に、と置き換えることもできるでしょう。この無作為に行う場合、よく使われるのが乱数表。この乱数表に従って各層ごとに必要数のサンプリング行うことで母集団の全体把握が擬似的に可能となります。このようはサンプリング手法を地図になぞらえて説明すると、対象とするエリアをある均一の単位(これが層となります)で分割しその中のデータを取得します。この時に選択する場所をどう決めるかの一手段として乱数表を利用して位置決めされた場所を特定するというものです。この手法では、2次元のX-Y座標で考えれば、a+b個の乱数を使用してX軸のa個の乱数ごとにY軸のbで決まるポイントが特定できるため、最終的にab個のサンプリングが可能になります。この手法を使用する場合注意することとして、どのように層別に分けるかということとその層数となります。この判断基準として統計学的な「分散」状況を確認してみることと言われています。基本的に分割するほど分散は集約されていくと言われ、その分散にあまり変化が見られなくなったところが分割の妥当性を判断する目安と言うものです。