こんにちは!
消費財メーカーのデータサイエンティストを経て現在は会社経営をしている、ウマたん(@statistics1012)です!
各方面からDXという言葉が聞こえてくるようになりましたが、攻めのデータ活用を推進するためには守りのデータマネジメントが非常に重要になってきます。
そんなデータマネジメントを体系的にまとめたのがDMBOK(ディンボック)です。
そのDMBOKの中で取り上げられている項目として以下のDAMAホイール図が有名です。
10個の各領域と、それら全体をまとめあげるデータガバナンスがあります。
それらの領域の中でも、この記事ではデータモデリングとデザインについて見ていきましょう!
また私自身がデータマネジメントについてアニメーションで分かりやすく学べる講座を公開しておりますので体系的に深く学びたい方はそちらも参考にしてみてください!
【初学者向け】データマネジメント入門!DX推進やAI 導入を支える重要な要素をDMBOKに沿ってみていこう!
【オススメ度】 | |
---|---|
【時間】 | 1.5時間 |
自分で言うのもなんですが、データマネジメントについてDMBOKに沿ってこれでもかというくらい分かりやすくまとめています!
データモデリングとデザインとは
このデータモデリングとデザインは、
簡潔に言うとデータの関係性を図で示し可視化して管理すること
です。
DMBOKでは以下のように言っています。
データモデリングとは、データ要件を洗い出し、分析し、取扱スコープを定めるプロセスであり、データ要件を記述し伝えるために、明確に定義されたデータモデルと呼ばれる様式が用いられる。
データアーキテクチャを描く上でもこのデータモデリングとデザインが非常に重要になってきます。
データアーキテクチャでは、現在の状況を整理して、将来のデータ活用をビジネス観点から定義し、それを実現するためにどんなデータが必要かどうやってデータを取得してどこで管理するかを考えていきます。
この際に将来的なデータの関係性を可視化するのがデータモデリングとデザインの役割になります。
これを元に実際の実装に落とし込んでいきます。
ではどうやってデータモデリングをおこなっていけばよいのでしょうか?
データモデリングとデザインってどうすればいいの?
いわゆるER図というのが一般的によく使われるデータモデリングの設計図です。
ER図とは、Entity Relationship Diagramの略です。
Eはエンティティ(Entity)の略で、Rはリレーションシップ(Relationship)の略です。つまりER図は「エンティティ=モノ」と「リレーションシップ=関係」の組み合わせを指します。
要はデータの関係性を表した図です。
そしてER図は
・概念モデル
・論理モデル
・物理モデル
と3つのモデルにわかれています。
概念モデルでは以下のようにモノとアクションを簡単につないで設計します。
そして論理モデルでは、そこに対して詳しい情報を肉付けしていきます。
以下のように、どのデータテーブルにどんなデータが必要なのかを図示していきます。
そして最終的な物理モデルでは、それを実装ベースに落としていきます。
ここでは、採用するデータウェアハウスにあわせてより詳細設計をしていきます。
念入りにデータモデリングとデザインを行うことで、ビジネス貢献の生まれるデータアーキテクチャの実現に一歩近づきます。
この領域において2つ注意点があります。
・ビジネスサイドも巻き込む
・今後の保守・運用の方針を決める
この注意点に関してはデータマネジメント全体において頻出する課題なのですが、必ずここでもおさえておいて欲しいポイントです。
ビジネスサイドも巻き込む
まず、データサイドだけで決めるのではなくビジネスサイドも巻き込む必要があるということ。
データモデリングとデザインの領域をデータサイドだけで決めてしまうとビジネスに直結しないデータアーキテクチャが出来上がってしまいます。
ビジネスに直結するデータアーキテクチャを実現する上でもデータモデルはビジネスサイドへのヒアリングやビジネスサイドを巻き込んだディスカッションによって決めていきましょう。
今後の保守・運用の方針を決める
またデータモデリングとデザインを設計して終わりではなく、今後どのように管理して更新していくか運用面を明確に決めること。
企業活動においてデータの種類や量は日に日に増加していきます。
そうなったときに、初期に構築したデータモデルを更新しないでいると現実のデータと手元の設計書が乖離していくことになります。
私の現場でも実際に設計書が形骸化していき、現状が把握しにくくなってしまっていることが多々ありました。
これは多くの企業が抱えている問題なのですが、現場にいると自分たちは長年の経験で設計書がなくても理解出来ているので設計書の更新をないがしろにしがちです。
データモデリングの設計書を更新する作業というのは、どうしても地味で面白くないしあまり注目もされない領域なのです。
ただ、そうするとデータサイドの領域が極度に属人化していき、組織としては不健全な状況になってしまいます。
これを防ぐためには、必ずマネジメント層がこのデータモデリング設計書の更新の重要性に理解を示し定期的に設計書の更新をしていく運用を作ることが大事になってきます。
データを管理するのは地味に見えますが、非常に重要な領域なのです!
これをマネジメント層、いや全社員が理解してあげることが大事です。
DMBOKのデータモデリングとデザイン領域 まとめ
最後に簡単にまとめておきましょう!
・データモデリングとデザインは、簡潔に言うとデータの関係性を図で示し可視化して管理すること。
・ER図を概念モデル、論理モデル、物理モデルの流れで設計していく。
・ビジネスサイドを巻き込んで設計することそして、実装後の運用まで見込んで設計することが大事である。
以下のYoutube動画でデータマネジメント全体について分かりやすく解説していますので是非チェックしてみてください!
また私自身がデータマネジメントについてアニメーションで分かりやすく学べる講座を公開しておりますのでそちらも参考にしてみてください!
【初学者向け】データマネジメント入門!DX推進やAI 導入を支える重要な要素をDMBOKに沿ってみていこう!
【オススメ度】 | |
---|---|
【時間】 | 1.5時間 |
自分で言うのもなんですが、データマネジメントについてDMBOKに沿ってこれでもかというくらい分かりやすくまとめています!
また、以下の記事でデータマネジメントの体系「DMBOK」について各領域をまとめていますので是非そちらもあわせてチェックしてみてください!