07-データサイエンス

データサイエンス(Part.1)|データサイエンスの概要 | 現役エンジニア&プログラミングスクール講師

目標

「データサイエンス」について概要を理解する
「データサイエンティスト」について概要を理解する
「データリテラシー」について概要を理解する
「データサイエンスが求められる背景」について理解する

データサイエンスの概要

データサイエンスとは

データサイエンスという言葉には明確な定義はありません。ですが、次のことが全て含まれる用語となります。

  • データを収集すること。(どのように収集するかを含む)
  • 収集したデータを分析すること。(どのように分析するかを含む)
  • 分析した結果から問題の解決や現象の解明を行う(解決のための知識が必要)

「データサイエンス」はデータを分析することだけを指す用語(学問)ではありません。

データサイエンティストとは

データサイエンティストとは「事業・業務に精通したデータ解析・分析ができる人材」のことです。具体的には「ビジネスの課題を理解して解決するスキル」「統計・情報処理・人工知能などの知識を利用できるスキル」「データベースやITインフラ、プログラミングなどを理解利用できるスキル」をもつ人材です。

一般社団法人データサイエンティスト協会ではこれらを「ビジネス力」「データサイエンス力」「データエンジニアリング力」として必要なスキルとしています。

データサイエンティスト協会ではこれらのスキル(「ビジネス力」「データサイエンス力」「データエンジニアリング力」)に対してチェック項目を作成しています。

データリテラシー

データリテラシーとは、「データを読み、使い、分析し、データを基に議論できる能力」のことをいいます。

データを扱うことが日常となっている現代社会においては、データリテラシーは企業から求められる能力として位置づけられています。

データサイエンスが求められる背景

産業構造の変化

産業構造の変化は、その時代時代の技術的な発展が大きく影響しています。18世紀にイギリスで起きた第一次産業革命は蒸気機関の発明によっておきた変化でした。現代社会では「ロボット」や「AI」などの技術躍進が産業構造を変化させようとしています。

日本では、高齢化、就労人材不足などの生産人口の減少も相まって、その解決のひとつとして「ロボット」「AI」が注目されています。(職種によっては供給超過で人員が余っている職業もあります。)この現代の産業構造の変化を「第4次産業革命」と呼びます。

(下の図は内閣府ホームページ「第2章 多様化する職業キャリアの現状と課題(第2節)」から引用)

引用元:https://www5.cao.go.jp/keizai3/2017/0118nk/n17_2_2.html

「第2章 多様化する職業キャリアの現状と課題(第2節)」では「就業構造の変化」と「技術進歩」の2点を軸として考察されています。

「ロボット」「AI」の技術には大量のデータが利用されます。つまり、大量のデータを利用する現代社会では、データを扱える人材が求められるのは必然と言えます。

「データ」は「21世紀の石油」と呼ばれています。

データ関連教育の活発化

データ関連の教育は次の視点から重要と考えられています。

  • 生産人口の減少
  • 技術継承に関する問題
  • 複雑化する問題
  • データ量の急増

労働人口の減少を解決する(少子化を完全に無くす。回復する。)には時間がかかりますが、「ロボット」や「AI」を利用すれば、少子化による労働者の不足を支えることが期待できます。

技術継承についても、そもそも継承には時間がかかったり、継承者自体が存在しなくなる可能性もあります。こちらについても「ロボット」や「AI」を利用して、継承機関の短縮や継承のための知識の保全が期待できます。

その他、複雑化する問題には、より多くの要因が潜んでいます。これらに対しても、「データサイエンス」を利用することで、精度の高い分析や問題解決が期待できます。

大量のデータを活用して分析・解析を行い、新しい知見や情報を得て、問題の解決や次の行動を決定する社会を「データ駆動型社会」と呼びます。

「大量のデータ」は「ビッグデータ」と呼ばれます。

データの量は年々増加傾傾向にあり、下は少し古い資料ですが2020年にデジタルデータ量の推移を確認できます。2020年に40ゼタバイトを超えるという予想はその通りとなり、2023年現在では約100ゼタバイトとなっています。

引用:https://www.soumu.go.jp/johotsusintokei/whitepaper/ja/h26/html/nc131110.html

1ZB(ゼタバイト)=1021バイト

大量のデータを保存できる記憶媒体の低価格化が同時に進んでいます。

これらの大量のデータを扱える人材が現代社会では必要とされているのが事実としてあります。本日は以上となります。

ブックマークのすすめ

「ほわほわぶろぐ」を常に検索するのが面倒だという方はブックマークをお勧めします。ブックマークの設定は別記事にて掲載しています。

「お気に入り」の登録・削除方法【Google Chrome / Microsoft Edge】「お気に入り」の登録・削除方法【Google Chrome / Microsoft Edge】について解説している記事です。削除方法も掲載しています。...
【パソコン選び】失敗しないための重要ポイント | 現役エンジニア&プログラミングスクール講師【パソコン選び】失敗しないための重要ポイントについての記事です。パソコンのタイプと購入時に検討すべき点・家電量販店で見かけるCPUの見方・購入者が必要とするメモリ容量・HDDとSSDについて・ディスプレイの種類・バッテリーの持ち時間や保証・Officeソフト・ウィルス対策ソフトについて書いています。...
RELATED POST
07-データサイエンス

データサイエンス| まとめ | 現役エンジニア&プログラミングスクール講師

2023年12月4日
プログラミング学習 おすすめ書籍情報発信 パソコン初心者 エンジニア希望者 新人エンジニア IT業界への就職・転職希望者 サポートサイト Programming learning Recommended schools Recommended books Information dissemination Computer beginners Prospective engineers New engineers Prospective job seekers in the IT industry Support site
07-データサイエンス

データサイエンス(Part.3)|データ分析のプロセス1(課題と仮説の設定方法) | 現役エンジニア&プログラミングスクール講師

2023年12月22日
プログラミング学習 おすすめ書籍情報発信 パソコン初心者 エンジニア希望者 新人エンジニア IT業界への就職・転職希望者 サポートサイト Programming learning Recommended schools Recommended books Information dissemination Computer beginners Prospective engineers New engineers Prospective job seekers in the IT industry Support site
07-データサイエンス

データサイエンス(Part.2)|データ分析の基本プロセス | 現役エンジニア&プログラミングスクール講師

2023年11月27日
プログラミング学習 おすすめ書籍情報発信 パソコン初心者 エンジニア希望者 新人エンジニア IT業界への就職・転職希望者 サポートサイト Programming learning Recommended schools Recommended books Information dissemination Computer beginners Prospective engineers New engineers Prospective job seekers in the IT industry Support site
07-データサイエンス

データサイエンス(Part.4)|データ分析のプロセス2(データの分類)|現役エンジニア&プログラミングスクール講師

2024年1月12日
プログラミング学習 おすすめ書籍情報発信 パソコン初心者 エンジニア希望者 新人エンジニア IT業界への就職・転職希望者 サポートサイト Programming learning Recommended schools Recommended books Information dissemination Computer beginners Prospective engineers New engineers Prospective job seekers in the IT industry Support site