書籍『統計的パターン認識と判別分析』のレビュー

最近発売された『統計的パターン認識と判別分析』のレビューを書く。
統計的パターン認識と判別分析 (シリーズ 情報科学における確率モデル 1)

各章の概要についてはコロナ社のサイトを参照されたい。
『シリーズ 情報科学における確率モデル』|書籍紹介

本書の「ご利益」を一言で表せば、回帰と識別(分類)という機械学習における2大タスクの定式化に現れる、(最小二乗誤差の意味で)最適な非線形関数の解釈を通じてこれらをより良く理解することに役立つ、と言えよう。本書では、この最適な非線形関数に現れる事後確率を「線形近似」するアプローチにより、解釈が進められる。実際に、線形回帰/識別関数が、非線形回帰/識別関数の「線形近似」となる事実が、丁寧な導出とともに具体的に示されており、読者は理解を大いに深めることができるだろう。後半の章では、主成分分析/線形判別分析→カーネル主成分分析/カーネル判別分析という流れで話が進み、これらは最終章の布石をなしている。そして最終章において、非線形判別写像に現れる事後確率を線形近似することにより、線形判別分析が導出できる、という事実が示されるのであった。事後確率の近似方法として、正規分布を仮定する場合など線形近似以外の方法についても具体的な言及がされていたのは好印象であった。最適な非線形判別分析をカーネル判別分析として再解釈する議論もまた、読者にとって有益であると思われる。

本書を通読して、確かに対象読者はパターン認識の基礎を「一通り」勉強し、微分積分線形代数に「十分に慣れた」大学院生や研究者向け、という印象を持った。本書は早い段階で積分を駆使した変分法や確率計算、行列やベクトル計算、行列の偏微分など、高度な数学的操作が現れるため、それらにある程度習熟していることが望ましい。さもなくば、とても「スラスラ」とは読めないであろう。巻末の付録には線形代数、最適化、確率統計の基礎事項がまとめてあり、読者への配慮は伺える。ただし、それらはあくまで備忘録として参照する程度に済むくらいの読者が対象といえるだろう。本書の「まえがき」では付録の存在・活用法について一切言及がないため、ここは幾分残念な点であった。

いくつかの誤植はあるが、ほとんどは軽微な修正で済む。

著者らの最近の論文(2016) は最終章の理解に役立つ(いくつかの誤植の確認はこの論文を参照しながら行った)
www.jstage.jst.go.jp