久しぶりの記事ですが、最近はPostgreSQLをゴリゴリと触る感じでもなくなってきているため、本記事もゆるめの感じでお送りしたいと思います。
■PostgreSQLの「パフォーマンス分析」とは
PostgreSQLのパフォーマンス分析は、ざっくり言って、以下のようなステップで進められます。(PostgreSQLには限らないと思いますが)
- パフォーマンスの状況から、課題について仮説を設定する。
- パフォーマンスに関連する何の情報を収集するかを決める。
- 情報を収集する。
- 収集した情報を加工し、分析しやすい形式に整える。
- 分析し、仮説を検証、ないしは何かを発見する。
- より深堀り、確証を高めるために、再度情報集をしたり、データを加工、分析したりする。
- 何か対策を打って、その結果を再度分析して、従前と比較する。
しかも、ある程度探索的な分析を行わざるを得ないため、データやグラフの形式を最初から決めておいたとしても、パフォーマンス分析がディープになればなるほど、それが現実的に役に立つかどうかは微妙になっていきます。(なので、最終的には、あらゆるグラフを網羅的に出力するレポートを作成する羽目になります)
そのため「Excel最強説」が流れるわけですが、再現可能性や繰り返しの作業についてはやはりいろいろと難がありますので、スクリプトで処理したくなってきます。