10-データベース

データベース(Part.5)| 正規化 | 現役エンジニア&プログラミングスクール講師

目標

「正規化」について概要を理解して正規化を行える

正規化の概要と正規化の手順

正規化の概要

正規化とは

正規化とはデータベースをコンピューター上で扱いやすくするための設計手法(整理整頓のための手法)です。

正規化がなぜ必要か

正規化されていないデータベースではデータの更新時にデータの不整合が発生しやすくなります。このことを更新不整合(または更新時異常)といいます。

正規形の種類

正規化を行った後の状態を「正規形」と呼びます。正規形には次の種類があります。通常、正規形は第3正規形かボイス・コッド正規形までを目標とします。それ以上だと制約が強すぎてデメリットが増える傾向があります。

  1. 第1正規形
  2. 第2正規形
  3. 第3正規形
  4. ボイス・コッド正規形
  5. 第4正規形
  6. 第5正規形

この記事では第3正規形までを扱っていきます。ボイス・コッド正規形は決定項がスーパーキーでない関数従属を取り除く正規化を行ったときの状態です。

重要用語の確認

タプル…データべースのレコード(行)のこと。

候補キー…タプルを一意に識別できる1つ以上の属性の集まり(主キーとしての候補)。

複合キー…複数の属性で構成される主キー。

非キー…どの候補キーにもならない通常の属性。

関数従属性…ある属性がきまると別の属性が決まること。

完全関数従属…複合キー全体に対して関数従属されていること。

部分関数従属…複合キーの一部の属性に対して関数従属されていること
取り除くことが必要(第2正規形)

推移的関数従属…属性がひとつ決まると「A→B→C」と順を追って関数従属が存在する状態
取り除くことが必要(第3正規形)

情報無損失分解…分解後の関連を自然結合できる(前の状態に戻すことができる)分解。
↔情報損失分解(結合の罠によって情報が戻らない)。

更新時異常…挿入時異常・削除時異常・修正時異常のことをいう。

正規化の手順

正規化の手順

正規化の手順は「非正規形」→「第1正規形」→「第2正規形」→「第3正規形」の順番で進んでいきます。

ここでは、おばあちゃんの駄菓子屋さんを例にデータベースの正規化を行っていこうと思います。ある日、近所の駄菓子屋のおばあちゃんからこんな事を頼まれたとします。

おばあちゃん

ねぇ、ねぇ、ほわほわ君、ちょっとお願いがあるんだよ。実は最近ね、お店の帳簿をつけるのに手が痛くてね、もっと管理が簡単にならないものかと思っていたんだけど、そこでほわほわ君が、でーたべーすってのを作れるって聞いたのよ。もしよかったら作ってくれないかねぇ?

ほわほわ君は、子供の頃からお世話になっているおばあちゃんの頼みなので快く引き受けました。そこで、おばあちゃんにこれまでの帳簿を見せてもらうことにしました。

ほわほわ君

おばあちゃん、分かりました。じゃ、どんな項目が必要かを確認しないといけないので、これまでの帳簿を参考までに見せてもらっていいですけ?

おばあちゃんから帳簿を預かって中身を確認すると次のようにノートにぎっしりと売り上げが書かれていました。

手渡された帳簿は正規化がされていない「非正規形」のデータベースということがほわほわ君にはすぐに分かりました。なので、ほわほわ君は正規化を行ってコンピューターが扱える状態を作り上げることにしました。

コンピューターにとってはこんな部分が苦手!

第1正規形

第1正規形の作成手順は次のようになります。

  1. 繰り返えしの項目を別々の行として編集する。
  2. 増えた行がもともと共通のものと分かるようにIDを振る。
  3. 切り離したテーブルが元のテーブルに一意に識別できる列をコピーする。

【繰り返えしの項目を別々の行として編集する。】

第1正規形を作成する最初の取り組みは「重複するフィールドをなくす」です。下のイラストにはデータベースのフィールド名「商品」「金額」「個数」が重複しているので、この重複をなくします。

まずはデータが繰り返して存在している行の下に1行追加します。

追加した行に上の行で繰り返し部分に表示されていたデータを移動してきます。この作業を繰り返えします。

全ての繰り返しのデータをひとつ目の「商品」「金額」「個数」に移動すると次のようになります。

【増えた行がもともと共通のものと分かるようにIDを振る。】
(行が増えていなくてもIDを振ります。下の図では0001や0009など)

【繰り返しで扱われていた部分を別のテーブルとして切り離す。】

下の赤枠部分を切り離します。

【切り離したテーブルが元のテーブルに一意に識別できる列をコピーする。】

以上で第1正規形が完成です。完成したテーブルは下のようになります。

この時点では更新不整合がまだ起こり得ます。

目標の第2正規形

第2正規形の作成手順は次のようになります。

  1. データ部分に「同じものを指す」のに「表記が違う」ものがないかを探す。
  2. 表記を統一してデータを一意に認識できるようIDを付ける。
  3. 複合キーの一部に関数従属していれば切り離す。(部分関数従属の除去)
  4. 部分関数従属の決定項を主キーとする。

【データ部分に「同じものを指す」のに「表記が違う」ものがないかを探す。】

次の図のように表記がばらばらの状態ではコンピュータがうまくデータベースを扱うことができません。

【表記を統一してデータを一意に認識できるようIDを付ける。】

【複合キーの一部に関数従属していれば切り離す。(部分関数従属の除去)】

下の図を確認すると「個数」は複合キー(売上IDと商品IDの組み合わせ)で決まる値となります(完全関数従属)。

この時、複合キーのどちらかを主キーとして値が一意に決まるものがあれば、それが部分関数従属となります。下の図では「商品ID」が決まれば「商品」と「値段」が決まるといった部分にあたります。

「商品ID」「商品」「値段」の部分を切り離すと下の図のようになります。赤い枠の部分が切り離されたテーブルです。今後これを「商品テーブル」と呼びます。

【部分関数従属の決定項を主キーとする】

上の図の水色の部分を削除します。この時出来上がった「商品テーブル」では、部分関数従属の決定項(商品ID)が主キーとなります。

ここまでが、第2正規形のテーブル作成の手順です。

この時点では更新不整合がまだ起こり得ます。

もう一つのテーブル(売上ID・お客さんID・お客さんのテーブル)を見てみるとこれは複合キーではなく「売上ID」が主キーとして利用されています。売上IDによって「お客さんID」や「お客さん」が決まる状態です。これは次の第3正規形を形成する時に考える推移的関数従属(推移関数従属)にあたります。

目標の第3正規形

第3正規形の作成手順は次のようになります。

  1. 主キーとなるもの(候補キー)を見つける。
  2. 非キー(どの候補キーにも含まれない属性)の中で関数従属がないかを確認。
  3. 非キー部分で関数従属していれば「推移的関数従属」となるので切り離す。

【主キーとなるもの(候補キー)を見つける。】

【非キー(どの候補キーにも含まれない属性)の中で関数従属がないかを確認。】

【非キー部分で関数従属していれば「推移的関数従属」となるので切り離す。】

ここまでで第3正規形のテーブルの作成は完了です。

今回は以上になります。次回以降はリレーションについて記事にしています。

「データベース」おすすめ書籍6選【初心者用3冊&実践用3冊】| 現役エンジニア&プログラミングスクール講師「データベース」初心者の方がデータベースを基本からしっかりと理解するためのお勧めの書籍について取り上げています。また中級者の方が更に進んだ学習ができる実践的な書籍についてお勧めできる3冊を取り上げています。ページの下部には「おすすめのITスクール情報」「おすすめ求人サイト」について情報を掲載中。...

ブックマークのすすめ

「ほわほわぶろぐ」を常に検索するのが面倒だという方はブックマークをお勧めします。ブックマークの設定は別記事にて掲載しています。

「お気に入り」の登録・削除方法【Google Chrome / Microsoft Edge】「お気に入り」の登録・削除方法【Google Chrome / Microsoft Edge】について解説している記事です。削除方法も掲載しています。...
【パソコン選び】失敗しないための重要ポイント | 現役エンジニア&プログラミングスクール講師【パソコン選び】失敗しないための重要ポイントについての記事です。パソコンのタイプと購入時に検討すべき点・家電量販店で見かけるCPUの見方・購入者が必要とするメモリ容量・HDDとSSDについて・ディスプレイの種類・バッテリーの持ち時間や保証・Officeソフト・ウィルス対策ソフトについて書いています。...
RELATED POST
10-データベース

データベース(Part.4)| 概念モデルから論理モデルへの変換(概念スキーマ)| 現役エンジニア&プログラミングスクール講師

2023年4月3日
プログラミング学習 おすすめ書籍情報発信 パソコン初心者 エンジニア希望者 新人エンジニア IT業界への就職・転職希望者 サポートサイト Programming learning Recommended schools Recommended books Information dissemination Computer beginners Prospective engineers New engineers Prospective job seekers in the IT industry Support site
10-データベース

データベース(Part.6)| リレーションと整合性制約 | 現役エンジニア&プログラミングスクール講師

2023年4月5日
プログラミング学習 おすすめ書籍情報発信 パソコン初心者 エンジニア希望者 新人エンジニア IT業界への就職・転職希望者 サポートサイト Programming learning Recommended schools Recommended books Information dissemination Computer beginners Prospective engineers New engineers Prospective job seekers in the IT industry Support site
10-データベース

データベース| まとめ | 現役エンジニア&プログラミングスクール講師

2023年4月3日
プログラミング学習 おすすめ書籍情報発信 パソコン初心者 エンジニア希望者 新人エンジニア IT業界への就職・転職希望者 サポートサイト Programming learning Recommended schools Recommended books Information dissemination Computer beginners Prospective engineers New engineers Prospective job seekers in the IT industry Support site
10-データベース

データベース(Part.1)| データベースの概要 | 現役エンジニア&プログラミングスクール講師

2023年3月29日
プログラミング学習 おすすめ書籍情報発信 パソコン初心者 エンジニア希望者 新人エンジニア IT業界への就職・転職希望者 サポートサイト Programming learning Recommended schools Recommended books Information dissemination Computer beginners Prospective engineers New engineers Prospective job seekers in the IT industry Support site
10-データベース

データベース(Part.3)| 概念モデルと論理モデル(概念スキーマ)| 現役エンジニア&プログラミングスクール講師

2023年4月1日
プログラミング学習 おすすめ書籍情報発信 パソコン初心者 エンジニア希望者 新人エンジニア IT業界への就職・転職希望者 サポートサイト Programming learning Recommended schools Recommended books Information dissemination Computer beginners Prospective engineers New engineers Prospective job seekers in the IT industry Support site
10-データベース

データベース(Part.8)| DBMSの仕組みと効率的なデータアクセス機構 | 現役エンジニア&プログラミングスクール講師

2023年4月7日
プログラミング学習 おすすめ書籍情報発信 パソコン初心者 エンジニア希望者 新人エンジニア IT業界への就職・転職希望者 サポートサイト Programming learning Recommended schools Recommended books Information dissemination Computer beginners Prospective engineers New engineers Prospective job seekers in the IT industry Support site