適切なサンプル数の算出方法 by SAR

統計解析の専門家が複数名在籍しています
※各種統計解析ソフトを使用して課題の明確化に努めております

調査に必要なサンプル数の考え方

アンケートの信頼度を95%とした場合は
許容誤差を5%以内であれば、サンプル数は約400人となります。
許容誤差を3%以内であれば、約1000人となります。
許容誤差が1%の場合は、約10,000人が必要です。


一般的に回答率の許容誤差を5%以内、且つ信頼度95%と設定して、 400人のサンプル数で調査実施が目安となります。







調査のサンプル数の算出手順

【STEP-1】まずは調査したい母集団(誰に調査するか)を考えます。

例えば、ある商品Aの3か月以内購入者を調べたい場合の母集団は「商品Aの3か月以内購入者」となります。
また、「関東県在住の男女20~60代の一般的な認知や評価」を調べたいのであれば、この人たちの人口が母集団となります。

必要なサンプル数は以下の数式で求められます。


画像

数式が難解ですので、以下のシンプルな数表をご覧ください。

ターゲットの全体像や特性を掴みたいのであれば、母集団のサイズ(人口)に関係なく400ss(384ss)で調査が可能なことがわかります。

画像




【STEP-2】調査データ集計の正確性(アンケート回答率の許容誤差)を決めます

アンケート回答者の許容誤差を5%とした場合、調査結果で「良かった」が50%とすると回答率の範囲は50%±5%となります。
つまり、母集団全体においてアンケートの回答率は45%~55%の中に収まります。
※同じ「良かった」が50%で許容誤差が1%の場合では、49%~51%のな範囲に収まります。

許容誤差が5%で設定した場合に『必ず5%は誤差が出る』と勘違いされる方が多いですが、あくまで『最大で±5%は、ずれる可能性がある』ということです。


画像

上記の様に許容誤差は、誤差が最大になる(例えば認知率や購入意向などの回答率で)50%を基準にします。
∵中心値である50%が最も誤差範囲が大きくなります。50%から離れるほど誤差範囲は小さくなります。

(回答率50%を基準に)誤差設定5%とした場合でも、回答率が10%の場合は誤差範囲が±2.9%と狭くなります。
キャンペーンの事前調査で認知率7.1%の商品が、事後調査で認知率10%以上に上昇すれば95%以上の信頼度を持って『認知率が上昇した』と言えます。






【STEP-3】信頼水準(信頼度)を決めます。

信頼水準はそのサンプルがどの程度の確率で許容誤差内に収まるかを表します。一般的には95%、99%で設定されます。
信頼水準95%の場合「100回中95回は許容誤差内の結果に収まる」ことりなります。


一般的に「許容誤差」5%、「信頼度」95%で統計上は十分意味があると言われています。


画像


【STEP-4】実際の分析での許容誤差の活用例

男女20~50代 800ss アンケートの分析(例) 各セグメント別の回答率の推計範囲を見てみましょう。
男性の購入意向率37.2%は、32.5%~41.9%の範囲に収まります。女性の購入意向率47.2%は42.3%~52.1%となり、女性の下限値が男性の上限値を上回りますので、『極めて差が大きい』と言えます。
男性の「ぜひ購入したい」13.5%、女性の16.6%と比較して、各許容誤差が±3.3~3.6%なので『やや差が見られる』と言えます。

性年代別はn=100となり精度が低くなりますので、「ぜひ購入したい」については男性20代(18.2%)と男性50代(9.3%)を比較して、やっと『やや差が見られる』と言えます。
男性20代の購入意向率50.3%、30代39.8%と比較して、各許容誤差が±8.7~9.8%なので『差が見られる』と言えます。
30代(39.8%)と40代(31.8%)を比較しても『やや差が見られる』と言えます。



n=100以下のセグメント比較は、慎重な分析と大胆な考察が必要となります。


画像







性年代別サンプル数の考え方① 男女別 『信頼度95%』

男女別に信頼度95%、許容誤差±5%以内で比較、分析したい場合は男女各400s『計800ss』が必要となります。
 → 5%以上の差であれば男女別に差が見られる可能性が非常に高い。また2.5%以上差があればが、男女別に差が見られる可能性がある。と言えます。

予算の都合で??男女各200s『計400ss』の場合の男女別でセグメントの許容誤差は±6.9%以内となります。
 → 7%以上の差であれば男女別に差が見られる可能性が非常に高い。また3.5%以上差があればが、男女別に差が見られる可能性がある。と言えます。

女性20~50代で10歳刻み各100s『計400ss』の場合は、各セグメントの許容誤差は±9.8%以内となります。
 → 10%以上の差であれば年代別に差が見られる可能性が非常に高い。また5%以上差があればが、年代別に差が見られる可能性がある。と言えます。

上記の許容誤差と解釈は、認知率・購入意向などの回答率が50%についてとなります。
回答率が10%であれば、許容誤差は概ね半分程度となります。


画像




性年代別サンプル数の考え方② 男女10歳刻みで必要なサンプル数 『信頼度95%』

先ずは、一般的な男女年代別のサンプル数の割付を表示しました。

画像


男女年代別のサンプル数30ss~100ssについて信頼度95%とした『サンプル数 × 許容誤差を一覧表』にしました。

回答率が10%と回答率50%で信頼できる回答率に大きな差があると同時に、やはり10代刻みのサンプル数は80ss以上欲しいと感じます。(理想論ですが)


画像


性年代別サンプル数の考え方③ 性年代別の人口を考慮 『信頼度95%』

先ずは左の日本の最新の性年代別の人口と構成比率をご覧ください。

次に、日本の最新の性年代別の人口を考慮して男女年代別に各セルを割付る案をご覧ください。
・ウエイトバックせずにGTのスコアが日本人全体の回答率に近似する優れものです。
・自由回答の出現率も正しくなる「お薦め案」です。


画像



「誰にも聞けない有意差検定とモナ評価/コンペア評価の話」 → はこちら



サンプルサイズの自動計算サイト一覧 『母集団のサイズ(規模)の入力有り』

「LACTIVATOR」⇒画面下部にあります 「データサイエンス共和国」⇒画面上部にあります

『母集団のサイズ(規模)の入力無し』
「FreeASY」⇒画面上部にあります ※許容誤差の計算が可能で便利です 「GrooveWorks Inc.」⇒画面下部からエクセルをダウロードしてください 「keisan」⇒画面上部にあります


『定性調査』は定性調査の匠と職人の集まり SARにお任せください!


■SARの定性調査  以下のリンクをご覧ください ▼定性調査職人の集合体 SAR
▼誰にも聞けないデプスインタビューのメリット ▼チャットGptによるデプスとグループインタビューの違い
▼SARのインタビュー調査 最高レベルのスタッフとシステム ▼経営者に対しリモートインタビューが可能 ▼理系大学生の採用に向けた調査/理系の転職採用インタビュー ▼食品調査の決定版 料理研究家ヒアリング調査『フードプロネット』
▼深掘り!日記調査システム『フォトインサイト』 ▼最もコスパが良い組み合わせ『日記調査⇒対象者絞り込み⇒FGI』はこちらをクリック

■SARの定量調査  以下のリンクをご覧ください ▼ラダリング法の紹介『決定版』 ▼経営者・意思決定者300名に対する定量調査 ▼究極のパッケージ評価調査 パッケージの評価と改善策は パッケージデザイナーに聞くのが一番

▼食品飲料の定量調査『フードプロネット』