ネットワークデータは、点と点の「つながり」によって表現されるデータです。決して特別なデータではなく、私たちの日常生活のさまざまな場面に存在しています。たとえば、SNSのフォロー関係やWebページ間のリンクのような明らかにネットワーク構造を持つデータだけでなく、ECサイトの購買履歴や株式市場の取引といった、一見ネットワークとは無関係に思えるデータにも、つながりの構造を見出すことができます。この「つながり」を活用することで、これまで見えなかったデータの新しい特徴を引き出すことが可能になります。
近年では、計算機リソースの向上や新しいアルゴリズムの登場により、ネットワークデータの実用化が急速に進んでいます。本書では、各手法について平易な言葉で解説することを目指すだけでなく、Pythonを用いたコード例を通じて、データの取り扱いから特徴抽出、さらにNode EmbeddingやGNNといった機械学習手法への応用までを実践的に紹介します。
また、単なる技術の羅列ではなく、身近なデータからネットワーク構造をどのように見出し、意味付けし、課題解決に結びつけるかという思考プロセスや応用事例にも重点を置いています。具体例としては、SNSのフォロー関係やWebページのリンクといった典型的なネットワークデータはもちろん、ECサイトの購買履歴やビジネス文書、さらにはレシートといった、通常「表形式」で扱われるデータに隠れた「つながり」を抽出・活用する手法を丁寧に解説します。