AIやIoTが実用化フェーズに入りつつあるのみならず、デジタルトランスフォーメーション(DX)への注目の高まりによって、事業やサービスを取り巻くデータを分析・活用・管理するためのインフラであるデータ基盤の重要性が増しています。 データ基盤を構築するにあたり、先行する事例から、Google Cloud(Google Cloud Platform, GCP)はデータ領域に強みがある、あるいは、BigQueryは高速に動作するデータウェアハウスである、と聞いたことがある方は多いでしょう。
本書では「データ基盤」そのものを体系的に整理しながら、Google Cloudの各サービスをどのように活用することで実用的なデータ基盤を構築できるか、また発展的なデータ分析ニーズに応えるデータ基盤をどのように設計できるか、といった点について解説しています。 特にGoogle Cloudはマネージドサービスを中心として提供されているため、その特性を正しくとらえることで、最大限の価値を発揮できるようになります。 実際にGoogle Cloudやオンプレミス、他のクラウドサービスを用いたデータ基盤の構築や設計に携わってきた筆者らによる一歩踏み込んだ解説が本書の特徴です。
本書は以下のような方におすすめです。
・これからデータ基盤の構築に関わる可能性があるエンジニア
・Google Cloudや他のクラウドサービスを利用しており、これからデータ領域での活用を広げようとしている方
また、すでにGoogle Cloudを利用しているエンジニアやデータ基盤に携わっているエンジニアにとっても、より洗練されたデータ基盤の設計を行うための知識やノウハウを得ることができるでしょう。
本書は近年のビジネス要件の変化からデータ基盤に求められる要件、一般的なデータ基盤のアーキテクチャを紹介した後、Google Cloudでの設計として以下のようなトピックを取り扱います。
・データウェアハウス
・データレイク/ETL/ELT
・データパイプラインマネジメント/データ統合
・データ基盤のセキュリティとコスト管理(アクセス制御、データ持ち出しの防止、重要データ検知)
・BI、データの可視化
・発展的な分析(地理情報分析、機械学習、リアルタイム分析)