07-データサイエンス

データサイエンス(Part.8)|データ分析のプロセス3(相関分析・回帰分析)

目標

「相関分析・回帰分析」について理解する

量的変数 → 量的変数(数値変数 → 数値変数)の関係を検証します。

相関分析(Correlation Analysis)

手法の概要

  • 2つの変数の 線形的な関連の強さと方向 を測る方法。
  • 代表的なのは ピアソンの相関係数 (r)

数式イメージ:

  • +1 → 完全な正の相関(片方が増えればもう片方も増える)
  • -1 → 完全な負の相関(片方が増えればもう片方は減る)
  • 0 → 無相関(関連なし)

利用方法

  • 変数間に「関係がありそうか」を探るとき。
  • 因果関係を証明するものではない(あくまで関係の強さ)。

具体的な用途事例

  • 健康: 運動量と体重の関係。
  • マーケティング: 広告費と売上の相関を調べる。
  • 教育: 勉強時間とテスト点数の関係。

相関分析の分析例

例えば、次のような広告費と売上の関係表があったとき「CORREL関数」を利用して相関関係を確認することができます。

CORREL関数

上の表で広告費のデータがB3からB8に、売上のデータがC3からC8にあるので、CORREL関数では次のように第一引数、第二引数をセットすることになります。

  • A列 = 広告費
  • B列 = 売上

=CORREL(B3:B8, C3:C8)

👉 出力例:この結果、0.98(非常に強い正の相関がある)という相関係数が得られることになります。

散布図で確認

相関係数は散布図でも確認できます。

  1. データを選択(広告費と売上の2列)
  2. 挿入 → 散布図 を選択
  3. データ点が右上がりに並べば「正の相関」

近似曲線を表示し、グラフオプションから「グラフにR-2乗値を表示する」にチェックをいれても相関係数を確認できます。

回帰分析(Regression Analysis)

手法の概要

  • ある変数(目的変数)を、他の変数(説明変数)から 予測 するための統計モデル。
  • 一番基本は 線形回帰(Linear Regression)

数式イメージ:

  • Y: 目的変数(売上など)
  • X: 説明変数(広告費など)
  • a: 切片(X=0のときのYの値)
  • b: 回帰係数(Xが1増えたときYがどれだけ増えるか)
  • ε: 誤差

利用方法

  • 「この要因は結果にどれだけ影響しているか?」を知りたいとき
  • 予測モデルを作りたいとき

具体的な用途事例

  1. ビジネス・マーケティング
    • 広告費(Y)から売上(X)を予測。
    • 商品価格と販売数量の関係をモデル化(需要予測)。
  2. 教育
    • 勉強時間(X)から試験点数(Y)を予測。
  3. 医療
    • 投薬量(X)と血圧低下度(Y)の関係。

回帰分析の分析例

データ分析ツール → 回帰

  1. 「データ」タブ → 「データ分析」 → 「回帰分析」 を選択
  2. 入力範囲を指定
    • Y入力範囲 = 広告費(C3:C8)
    • X入力範囲 = 売上(B3:B8)
  3. 出力先を指定して実行

Y入力範囲X入力範囲 の入力に注意(ダイアログボックスではY入力範囲が先に表示されます。)

👉 出力例(一部抜粋)

  • 回帰式: 売上=1.6571×広告費売上 + 10.333(切片=10.333、係数=1.6571)
  • 決定係数 R² = 0.9841(モデルの当てはまりが非常に良い)

「データ」タブ→「データ分析」→「回帰分析」と選択します。

必要な値を入力します。

Y入力範囲X入力範囲 の入力に注意(ダイアログボックスではY入力範囲が先に表示されます。)

出力結果

重決定 R2:0.984105314480741
切片:10.3333333333333
X 値1:1.65714285714286

グラフ上で近似直線を追加

  1. 散布図を作成
  2. データ点を右クリック → 「近似直線の追加」
  3. 「線形回帰」を選択し、「グラフに数式を表示」「R²値を表示」にチェック
    👉 グラフ上に回帰式とR²が表示される

相関分析の分析例で行った操作と同じ

相関分析と回帰分析の違い

観点相関分析回帰分析
主な目的変数間の関係の強さを測る一方の変数から他方を予測
出力相関係数 r (-1〜+1)回帰式(Y=a+bX)と回帰係数
因果関係証明できない仮定すれば因果の方向を想定できる
広告費と売上に関連があるか?広告費を増やしたら売上はいくら伸びるか?

まとめ

  • 相関分析: 「関連の強さ」を数値で確認。探索的分析に有効。
  • 回帰分析: 「影響の大きさ」や「予測」を数式で表す。施策の効果推定や予測に有効。

今回は以上となります。

ブックマークのすすめ

「ほわほわぶろぐ」を常に検索するのが面倒だという方はブックマークをお勧めします。ブックマークの設定は別記事にて掲載しています。

「お気に入り」の登録・削除方法【Google Chrome / Microsoft Edge】「お気に入り」の登録・削除方法【Google Chrome / Microsoft Edge】について解説している記事です。削除方法も掲載しています。...
【パソコン選び】失敗しないための重要ポイント | 現役エンジニア&プログラミングスクール講師【パソコン選び】失敗しないための重要ポイントについての記事です。パソコンのタイプと購入時に検討すべき点・家電量販店で見かけるCPUの見方・購入者が必要とするメモリ容量・HDDとSSDについて・ディスプレイの種類・バッテリーの持ち時間や保証・Officeソフト・ウィルス対策ソフトについて書いています。...
RELATED POST
no image
07-データサイエンス

データサイエンス(Part.5)|データ分析のプロセス3(仮説のタイプ分け)

2025年6月16日
プログラミング学習 おすすめ書籍情報発信 パソコン初心者 エンジニア希望者 新人エンジニア IT業界への就職・転職希望者 サポートサイト Programming learning Recommended schools Recommended books Information dissemination Computer beginners Prospective engineers New engineers Prospective job seekers in the IT industry Support site
no image
07-データサイエンス

データサイエンス(Part.7)|データ分析のプロセス3(クロス集計・カイ二乗検定)

2025年9月2日
プログラミング学習 おすすめ書籍情報発信 パソコン初心者 エンジニア希望者 新人エンジニア IT業界への就職・転職希望者 サポートサイト Programming learning Recommended schools Recommended books Information dissemination Computer beginners Prospective engineers New engineers Prospective job seekers in the IT industry Support site
07-データサイエンス

データサイエンス(Part.3)|データ分析のプロセス1(課題と仮説の設定方法)

2023年12月22日
プログラミング学習 おすすめ書籍情報発信 パソコン初心者 エンジニア希望者 新人エンジニア IT業界への就職・転職希望者 サポートサイト Programming learning Recommended schools Recommended books Information dissemination Computer beginners Prospective engineers New engineers Prospective job seekers in the IT industry Support site
07-データサイエンス

データサイエンス(Part.1)|データサイエンスの概要

2023年11月25日
プログラミング学習 おすすめ書籍情報発信 パソコン初心者 エンジニア希望者 新人エンジニア IT業界への就職・転職希望者 サポートサイト Programming learning Recommended schools Recommended books Information dissemination Computer beginners Prospective engineers New engineers Prospective job seekers in the IT industry Support site
07-データサイエンス

【高評価スクール】AI人材を育成する「eラーニングプラットフォーム」ーキカガク編ー | 現役エンジニア&プログラミングスクール講師

2025年5月24日
プログラミング学習 おすすめ書籍情報発信 パソコン初心者 エンジニア希望者 新人エンジニア IT業界への就職・転職希望者 サポートサイト Programming learning Recommended schools Recommended books Information dissemination Computer beginners Prospective engineers New engineers Prospective job seekers in the IT industry Support site