音楽情報処理 第12回
音楽情報処理
第12回:音楽認識のための基礎数理(クラスタリング)(6/26実施)
目標
我々、ヒトは音楽を聞いて、リズム、メロディ、ジャンル、コード信号等さまざまな音楽的表象を心の中で感じることができる。
この回と次回にかけてこの問題を計算機で取り扱っていくための手法について学ぶ。
この回では、音楽だけではなく広くパターン認識分野で使われているクラスタリングと関連して最尤推定(最も尤もらしいものを推定する手法)やEMアルゴリズムについての理解を目指す。
- k-meansアルゴリズム
- GMM(Gaussian Mixture Model)
- EMアルゴリズム(EMアルゴリズム徹底解説 Pythonを用いたわかりやすい解説)
- k-means と GMM/EM の対応
事前準備
確率・統計に関して最低限の知識を有していることが前提となります。「情報科学のための確率・統計」の受講者はその内容のおさらいをしておいてください。
そうでない場合、独自での勉強が必要です。特に、ベイズの定理についてはお話しの基礎なる部分なので、
条件付き確率と独立、事前確率、事後確率という用語についてはさっと耳に入ってくるようにしておいてください。
簡単なものでも良いので演習問題をこなしておくことを勧めます。
「深層学習」をツールとして使われることも増えてきていますが、情報系の学生としてはその背景となる数理的な考え方を身につけておきたいところです。
そのためのバイブル的な教科書の一つに
「ビショップ著:パターン認識と機械学習(上下)(通称ビショップ本)」
があります。ここで取り上げる内容は、ビショップ本(下巻9章)での勉強にむけてのイントロダクションに相当します。
ビショップ本での内容のうちいくつかは有志によりソースコードが公開されています。
- 上記の事前準備を完了しておくこと
- 講義資料(ドラフト)
課題
本日中に以下の課題をまとめたミニレポート(pdf、2ページ以内)を提出する。
- ポスタリゼーションがどのようなアルゴリズムで実装されているのか論ぜよ。
- 授業内指定課題
2026.6.8
katayose@kwansei.ac.jp