音楽情報処理 第8回
音楽情報処理
第8回:自動・作編曲システムと構成原理(5/30実施)
目標
これまでに開発されてきた代表的な自動作・編曲システムの手法とその原理について理解する。そのうち、音楽制約と乱数の利用によってメロディを生成する方法をMAXでの実施例として理解する。
- 自動作・編曲研究の歴史的概観
- イリアック組曲(世界初の計算機による自動作曲の実験)
- ルールの利用
- 乱数の利用
- 自動作・編曲システムと創造性
- 主要自動作曲システム(深層学習以前)
- 主要自動作曲システム(深層学習以降)とその構成原理
- DeepBach(双方向RNNでのソプラノ課題(バスパート、アルト、テノールパートの生成))
- MusicTransformer(Google Brain 2018, 長期依存性を扱える自己回帰型Transformerによる(Relative Attention)によるMIDI音楽生成モデル)
- MuseNet(OpenAI 2019, 最大15楽器・多ジャンルに対応した音楽生成、GPT風のTransformerを用いた条件付き音楽生成)
- Mubert(Mubert Inc., 商用向けBGM生成AI。ユーザ入力に基づきルールベースと深層学習を組み合わせた生成(詳細なモデルは非公開))
- Jukebox(OpenAI, 2020 VQ-VAE+自己回帰Transformerで歌詞付き音楽生成、マルチスケール音声生成モデル)
- MusicLM(Google Research 2023, 階層的自己回帰型Transformerで音楽トークン列を生成、MuLanと音響トークン化を組み合わせたマルチモーダル生成)
- MusicLDM(UCSD 2023, CLAPと拡散モデル(Latent Diffusion)を統合、音楽の潜在表現を用いた高自由度な音楽生成)
- Udio(Uncharted Labs 2024, 歌詞・ボーカル付き音楽を即時生成。大規模言語モデル(LLM)+音声合成を用いた商用指向モデル(詳細非公開))
- 乱数と音楽制約の利用によるMAXでのメロディ生成テクニック
事前準備
- 主要自動作曲システムとその構成原理の所で取り上げているシステムのリンク先を探索し、視聴ならびに予習を行っておく。
- 講義資料(ドラフト)
課題
本日中に以下の課題をまとめたミニレポート(pdf、2ページ以内)を提出する。
講義資料(ドラフト)で示す課題について答えよ。
2025.5.24
katayose@kwansei.ac.jp