- 発売日:2025/03/27
- 出版社:技術評論社
- ISBN/JAN:9784297148522
目次
■1章 データ分析とは何か
01 データとは何か
データとは
質的データと量的データ
構造化データと非構造化データ
一次データと二次データ
02 データから価値を引き出す4ステップ~DIKWモデル
DIKWモデルとは
DIKWモデルの具体例
03 情報をもとに知識を引き出すデータ分析
重要な役割を果たすデータ分析
04 ゴールはあくまでデータを価値に変えること
データ分析により得られる成果
■2章 データ分析の目的と取り組む前の注意点
05 データ分析の目的①現状の正確な把握
現状把握はデータ分析の第一歩
06 データ分析の目的②新しい出来事の結果の予測
予測結果を活用した的確な意思決定
07 データ分析の目的③物事の関係性の説明
未知の課題や関係性を見つけ出し、新しく価値を創出
08 混同を避けるため注意したい関連分野
データ分析と混同しやすい関連分野
09 データ分析に取り組む前の注意点
データ分析において注意するケース
■3章 データ分析の代表的な手法
10 データの関係性を明らかにする分析手法
データを構成する特徴量
回帰分析
AI・機械学習による回帰分析
主成分分析
因子分析
11 データをいくつかのグループに分ける分析手法
グループ分けは重要な分析手法の1つ
分類
クラスタリング
12 データ間の差を比較する分析手法
施策の効果を考える際に役立つ分析
統計的仮説検定の注意点
13 データ間の因果関係を明らかにする分析手法
相関関係と因果関係
統計的因果推論
■4章 データ分析を支える周辺技術とツール
14 ETLツール
ETLツールとは
ETLツールを利用するメリット
主要なETLツール
15 BIツール
BIツールとは
BIツールの役割
主要なBIツール
16 AutoML
AutoMLとは
AutoMLツールの主な機能
主要なAutoMLツール
17 データ分析プラットフォーム
データ分析プラットフォームとは
データ分析プラットフォームを利用するメリット
オンプレミス型とクラウド型
主要なクラウド型データ分析プラットフォーム
■5章 データ分析プロジェクトの企画から準備まで
18 データ分析プロジェクトとは
データ分析プロジェクトの重要な要素
データ分析プロジェクトとシステム開発プロジェクトとの違い
19 データ分析プロジェクトの全体像
企画→分析→評価の3ステップ
分析の企画
分析の実施
分析結果の評価
20 データ分析プロジェクトチーム体制と役割
データ分析プロジェクトで必要な役割
チーム編成時のポイント
21 プロジェクトのゴールと目標の設定
似ているようで異なる「ゴール」と「目標」
ゴール設定のポイント~KGI
「目標」設定のポイント~KPI
密接に関連するKGIとKPI
22 解決したいビジネス課題と仮説の設定
課題と仮説の設定がプロジェクト成功の鍵
ビジネスの目標達成を阻害している課題の明確化
データ分析を用いた解決が適しているか確認
仮説の設定
23 プロジェクトのスコープ設定
曖昧にすべきでないスコープ設定
スコープ設定のアプローチ
スコープの変更管理、ステークホルダーとの合意
24 費用の見積もりと費用対効果の評価
プロジェクトにかかる費用、ビジネス効果の事前確認
費用対効果の評価
25 分析方針の検討
プロジェクト開始時に検討しておくべき要素
分析に必要なデータの特定と収集方法などの確認
データを加工する方針の決定
使用する分析手法や可視化手法の選択
分析結果の評価指標の決定
分析結果のアウトプットイメージの検討
26 データを収集する準備
分析に必要なデータと入手手段の確認
セキュリティ対策と法令遵守
■6章 データ分析の実施
27 データの確認
生データの確認
データの全体像の確認
データの可視化
統計量を算出する
データの全体像を確認した上で、分析に適したデータかどうかを確認
28 データの加工①データの形式を揃える
データの加工を行う3ステップ
データの形式を揃える
数値データ
日時データ
カテゴリデータ
名寄せ
29 データの加工②データクレンジング
データクレンジング
外れ値の処置の方針
外れ値の処置
欠損値の処置の方針
欠損値の処置
30 データの加工③データ構造の加工
データ構造の加工
データの統合
データの抽出と集計
データの正規化と標準化
31 データ分析①現状把握、将来予測、未知の関係性探索
現状把握
将来予測
未知の関係性探索
32 データ分析②数理最適化
数理最適化とは
■7章 データ分析の結果の評価
33 分析結果の正確性の評価①回帰分析の評価指標
回帰分析の評価指標
34 分析結果の正確性の評価②分類問題の評価指標
分類問題の評価指標
35 分析結果の正確性の評価③モデルの汎化性能の評価
モデルの汎化性能の評価
AICとBIC
交差検証(クロスバリデーション)
36 分析結果の信頼性の評価
分析結果の評価には「信頼性」も重要
統計的有意性の評価
データの品質評価
37 分析結果の洞察
洞察に有効な特異点、相違点、傾向性、関連性
可視化による特性の発見
38 分析結果のビジネス上の意味を捉える
重要な2つのポイント
相関関係と因果関係の区別
ドメイン知識の活用
39 分析の改善・見直し①データの改善
分析は必ず改善や見直しを検討
データの改善
40 分析の改善・見直し②手法の改善
データの特性に適した手法への切り替え
より高度なアルゴリズムへの変更
モデルの性能向上テクニック
41 分析の改善・見直し③評価指標の見直し
評価指標の見直しは重要
42 分析結果の報告①報告に記載すべき事項
報告は重要なプロセス
報告のサマリー
データ分析の背景と目的
分析に使用したデータの概要
分析方法とプロセス
分析結果
考察と推奨アクションの提言
43 分析結果の報告②報告書作成のポイントと注意点
報告は受け手の印象を大きく左右する
ストーリーの考案
表現上の注意点
報告内容をわかりやすくする工夫
見栄えや表記ルールなどの基本を徹底する
表やグラフの活用
最後に見直しとリハーサル
■付録 組織でデータを活用するために
01 効率的にデータを活用するための組織づくり
組織におけるデータ活用でよくある課題
データガバナンスとデータマネジメント
データパイプラインの整理
データマネジメントを始めるための知識体系「DMBOK」
02 データ分析人材の確保
データ分析人材に求められるスキル
データ分析に必要な基礎知識
どのようにして育成を行うか
01 データとは何か
データとは
質的データと量的データ
構造化データと非構造化データ
一次データと二次データ
02 データから価値を引き出す4ステップ~DIKWモデル
DIKWモデルとは
DIKWモデルの具体例
03 情報をもとに知識を引き出すデータ分析
重要な役割を果たすデータ分析
04 ゴールはあくまでデータを価値に変えること
データ分析により得られる成果
■2章 データ分析の目的と取り組む前の注意点
05 データ分析の目的①現状の正確な把握
現状把握はデータ分析の第一歩
06 データ分析の目的②新しい出来事の結果の予測
予測結果を活用した的確な意思決定
07 データ分析の目的③物事の関係性の説明
未知の課題や関係性を見つけ出し、新しく価値を創出
08 混同を避けるため注意したい関連分野
データ分析と混同しやすい関連分野
09 データ分析に取り組む前の注意点
データ分析において注意するケース
■3章 データ分析の代表的な手法
10 データの関係性を明らかにする分析手法
データを構成する特徴量
回帰分析
AI・機械学習による回帰分析
主成分分析
因子分析
11 データをいくつかのグループに分ける分析手法
グループ分けは重要な分析手法の1つ
分類
クラスタリング
12 データ間の差を比較する分析手法
施策の効果を考える際に役立つ分析
統計的仮説検定の注意点
13 データ間の因果関係を明らかにする分析手法
相関関係と因果関係
統計的因果推論
■4章 データ分析を支える周辺技術とツール
14 ETLツール
ETLツールとは
ETLツールを利用するメリット
主要なETLツール
15 BIツール
BIツールとは
BIツールの役割
主要なBIツール
16 AutoML
AutoMLとは
AutoMLツールの主な機能
主要なAutoMLツール
17 データ分析プラットフォーム
データ分析プラットフォームとは
データ分析プラットフォームを利用するメリット
オンプレミス型とクラウド型
主要なクラウド型データ分析プラットフォーム
■5章 データ分析プロジェクトの企画から準備まで
18 データ分析プロジェクトとは
データ分析プロジェクトの重要な要素
データ分析プロジェクトとシステム開発プロジェクトとの違い
19 データ分析プロジェクトの全体像
企画→分析→評価の3ステップ
分析の企画
分析の実施
分析結果の評価
20 データ分析プロジェクトチーム体制と役割
データ分析プロジェクトで必要な役割
チーム編成時のポイント
21 プロジェクトのゴールと目標の設定
似ているようで異なる「ゴール」と「目標」
ゴール設定のポイント~KGI
「目標」設定のポイント~KPI
密接に関連するKGIとKPI
22 解決したいビジネス課題と仮説の設定
課題と仮説の設定がプロジェクト成功の鍵
ビジネスの目標達成を阻害している課題の明確化
データ分析を用いた解決が適しているか確認
仮説の設定
23 プロジェクトのスコープ設定
曖昧にすべきでないスコープ設定
スコープ設定のアプローチ
スコープの変更管理、ステークホルダーとの合意
24 費用の見積もりと費用対効果の評価
プロジェクトにかかる費用、ビジネス効果の事前確認
費用対効果の評価
25 分析方針の検討
プロジェクト開始時に検討しておくべき要素
分析に必要なデータの特定と収集方法などの確認
データを加工する方針の決定
使用する分析手法や可視化手法の選択
分析結果の評価指標の決定
分析結果のアウトプットイメージの検討
26 データを収集する準備
分析に必要なデータと入手手段の確認
セキュリティ対策と法令遵守
■6章 データ分析の実施
27 データの確認
生データの確認
データの全体像の確認
データの可視化
統計量を算出する
データの全体像を確認した上で、分析に適したデータかどうかを確認
28 データの加工①データの形式を揃える
データの加工を行う3ステップ
データの形式を揃える
数値データ
日時データ
カテゴリデータ
名寄せ
29 データの加工②データクレンジング
データクレンジング
外れ値の処置の方針
外れ値の処置
欠損値の処置の方針
欠損値の処置
30 データの加工③データ構造の加工
データ構造の加工
データの統合
データの抽出と集計
データの正規化と標準化
31 データ分析①現状把握、将来予測、未知の関係性探索
現状把握
将来予測
未知の関係性探索
32 データ分析②数理最適化
数理最適化とは
■7章 データ分析の結果の評価
33 分析結果の正確性の評価①回帰分析の評価指標
回帰分析の評価指標
34 分析結果の正確性の評価②分類問題の評価指標
分類問題の評価指標
35 分析結果の正確性の評価③モデルの汎化性能の評価
モデルの汎化性能の評価
AICとBIC
交差検証(クロスバリデーション)
36 分析結果の信頼性の評価
分析結果の評価には「信頼性」も重要
統計的有意性の評価
データの品質評価
37 分析結果の洞察
洞察に有効な特異点、相違点、傾向性、関連性
可視化による特性の発見
38 分析結果のビジネス上の意味を捉える
重要な2つのポイント
相関関係と因果関係の区別
ドメイン知識の活用
39 分析の改善・見直し①データの改善
分析は必ず改善や見直しを検討
データの改善
40 分析の改善・見直し②手法の改善
データの特性に適した手法への切り替え
より高度なアルゴリズムへの変更
モデルの性能向上テクニック
41 分析の改善・見直し③評価指標の見直し
評価指標の見直しは重要
42 分析結果の報告①報告に記載すべき事項
報告は重要なプロセス
報告のサマリー
データ分析の背景と目的
分析に使用したデータの概要
分析方法とプロセス
分析結果
考察と推奨アクションの提言
43 分析結果の報告②報告書作成のポイントと注意点
報告は受け手の印象を大きく左右する
ストーリーの考案
表現上の注意点
報告内容をわかりやすくする工夫
見栄えや表記ルールなどの基本を徹底する
表やグラフの活用
最後に見直しとリハーサル
■付録 組織でデータを活用するために
01 効率的にデータを活用するための組織づくり
組織におけるデータ活用でよくある課題
データガバナンスとデータマネジメント
データパイプラインの整理
データマネジメントを始めるための知識体系「DMBOK」
02 データ分析人材の確保
データ分析人材に求められるスキル
データ分析に必要な基礎知識
どのようにして育成を行うか
