07-データサイエンス

データサイエンス(Part.14)|準実験:回帰不連続デザイン(RDD)

目標

回帰不連続デザインについて理解する

回帰不連続デザイン

回帰不連続デザインは、ある基準値(カットオフ)を境にして、介入を行い、基準値付近の平均の違いを「処理の効果」と解釈する方法です。

基準値付近の平均を利用する理由は、その付近では、処置以外の要因はほぼ同じ(大きな要因とならない)とみなせるからです。そのため、カットオフ前後でアウトカムの平均がどのくらいジャンプ(不連続)するかを見て、それを「処置の効果」と解釈します。

  • 基準値付近に注目することが重要です。遠く離れたデータまで含めると「他の要因の差」が混ざってしまいます。
  • グラフにすると、基準点を境にアウトカムが「階段状」に変化しているかどうかが視覚的にわかります。

例)テストで50点以上なら奨学金あり、未満なら無しとしたとき、49点と50点の学生は、学力や家庭環境などほぼ同じなのに、進学率に影響がでる。

ポイント整理

  • 制度のルール:「50点以上なら奨学金あり」「未満なら無し」
  • 観察される現象
    • 49点と50点の学生は、点数の差はわずか1点。
    • 学力や家庭環境などの背景要因はほぼ同じと考えられる。
    • しかし、制度上は「奨学金なし」と「奨学金あり」に分かれる。
  • 因果推論の考え方
    • 進学率に差が見られた場合、その差は「奨学金があるかないか」という処置の効果によるものと解釈できる。

回帰不連続デザインの実施例

サンプルデータ(架空例)

  • 処置ルール
    • 得点が50点以上なら奨学金あり(T=1)
    • それ未満はなし(T=0)
  • 進学率の設定
    • 奨学金なし(T=0):進学率 約**%
    • 奨学金あり(T=1):進学率 約**%
ID得点 (X)奨学金 (T)大学進学 (Y)
14100
23700
35511
46211
54900
65311
74701
85811
94500
105111
116011
123900
134200
146411
154600
165211
175611
184000
196111
204401
214300
224800
235911
245011
255411
263800
273600
286311
295711
303500
316611
324100
336511
345211
354600
363400
375511
384800
396011
406211
413900
424400
435111
446711
455311
464701
475811
484900
495911
504200

Excelでの手順

  1. 「奨学金ありグループ」と「なしグループ」に分ける
  2. 平均値を求める(=AVERAGEIF)
    • 奨学金なしの進学率(平均Y)
    • 奨学金ありの進学率(平均Y)
  3. 奨学金の効果(推定値)= 奨学金ありの進学率(平均Y)– 奨学金なしの進学率(平均Y)
  4. 散布図を作成し、「得点X」を横軸、「進学率Y」を縦軸にプロット
    • 50 点を境に進学率がジャンプしていれば、処置効果が視覚的に確認できる
  • (奨学金無しの平均)セルH3=AVERAGEIF($D$3:$D$52,0,$E$3:$E$52)
  • (奨学金有りの平均)セルH4=AVERAGEIF($D$3:$D$52,1,$E$3:$E$52)
  • (効果)セルH5=SUM(H4-H3)

出力結果とその解釈

出力結果:

カットオフ
 ルールとして「50点以上なら奨学金あり、未満ならなし」 → カットオフ=50

奨学金無し(T=0)の平均進学率 = 0.125
 つまり「奨学金がない学生のうち、12.5%が進学した」

奨学金あり(T=1)の平均進学率 = 1.0
 つまり「奨学金がある学生は、ほぼ全員(100%)進学した」

処置効果 = 1.0 – 0.125 = 0.875
 → 奨学金の有無によって、進学率が87.5ポイント上昇した と解釈できる。

散布図で可視化

「得点X」を横軸、「進学率Y」を縦軸にプロットして散布図を作成します。

50 点を境に進学率がジャンプしていれば、処置効果が視覚的に確認できたことになます。

解釈:49点と50点といった「ほぼ同じ学力・背景」の学生なのに、奨学金の有無だけで進学率に大きな差が出ている

今回は以上となります。

ブックマークのすすめ

「ほわほわぶろぐ」を常に検索するのが面倒だという方はブックマークをお勧めします。ブックマークの設定は別記事にて掲載しています。

「お気に入り」の登録・削除方法【Google Chrome / Microsoft Edge】「お気に入り」の登録・削除方法【Google Chrome / Microsoft Edge】について解説している記事です。削除方法も掲載しています。...
【パソコン選び】失敗しないための重要ポイント | 現役エンジニア&プログラミングスクール講師【パソコン選び】失敗しないための重要ポイントについての記事です。パソコンのタイプと購入時に検討すべき点・家電量販店で見かけるCPUの見方・購入者が必要とするメモリ容量・HDDとSSDについて・ディスプレイの種類・バッテリーの持ち時間や保証・Officeソフト・ウィルス対策ソフトについて書いています。...
RELATED POST
07-データサイエンス

データサイエンス(Part.8)|データ分析のプロセス3(相関分析・回帰分析)

2025年9月3日
プログラミング学習 おすすめ書籍情報発信 パソコン初心者 エンジニア希望者 新人エンジニア IT業界への就職・転職希望者 サポートサイト Programming learning Recommended schools Recommended books Information dissemination Computer beginners Prospective engineers New engineers Prospective job seekers in the IT industry Support site
07-データサイエンス

データサイエンス(Part.13)|準実験:傾向スコアマッチング(PSM)

2025年9月9日
プログラミング学習 おすすめ書籍情報発信 パソコン初心者 エンジニア希望者 新人エンジニア IT業界への就職・転職希望者 サポートサイト Programming learning Recommended schools Recommended books Information dissemination Computer beginners Prospective engineers New engineers Prospective job seekers in the IT industry Support site
07-データサイエンス

【高評価スクール】AI人材を育成する「eラーニングプラットフォーム」ーキカガク編ー | 現役エンジニア&プログラミングスクール講師

2025年5月24日
プログラミング学習 おすすめ書籍情報発信 パソコン初心者 エンジニア希望者 新人エンジニア IT業界への就職・転職希望者 サポートサイト Programming learning Recommended schools Recommended books Information dissemination Computer beginners Prospective engineers New engineers Prospective job seekers in the IT industry Support site
07-データサイエンス

データサイエンス(Part.6)|データ分析のプロセス3(t検定・ANOVA)

2025年9月1日
プログラミング学習 おすすめ書籍情報発信 パソコン初心者 エンジニア希望者 新人エンジニア IT業界への就職・転職希望者 サポートサイト Programming learning Recommended schools Recommended books Information dissemination Computer beginners Prospective engineers New engineers Prospective job seekers in the IT industry Support site
07-データサイエンス

データサイエンス(Part.4)|データ分析のプロセス2(データの分類)

2024年1月12日
プログラミング学習 おすすめ書籍情報発信 パソコン初心者 エンジニア希望者 新人エンジニア IT業界への就職・転職希望者 サポートサイト Programming learning Recommended schools Recommended books Information dissemination Computer beginners Prospective engineers New engineers Prospective job seekers in the IT industry Support site