CrestMuse Symposium 2008
研究内容詳細 〈後藤グループ(産業技術総合研究所)〉



「話声を歌声に自動変換する」
齋藤 毅、後藤 真孝 体験デモ

歌詞の朗読音声(話声)を歌声に自動変換する歌声合成システムを提案する.このシステムは,音声分析合成系STRAIGHTによる分析/合成処理過程において,基本周波数,スペクトル,音韻長を制御するモデルによって歌声特有の音響特徴を操作することで話声を歌声に変換する.従来の歌声合成システムに見られるテキストからの歌声合成ではなく,話声からの歌声合成という新しいアプローチを採用することで,高品質な歌声合成だけでなく,「歌詞を朗読するだけで自分の歌声を作り・聴くことができる」という新しい歌声情報処理を可能にした.更に,このシステムによる歌声合成を通じて,歌声を知覚する上で重要な音響特徴を明らかにした.


「似た歌声の曲を探す」
藤原 弘将、後藤 真孝 体験デモ

ボーカルの声質の類似度に基づく楽曲検索システムを開発した.本システムは,クエリとして与えられた楽曲と類似した声質を持つ楽曲を予め登録したデータベース中から検索する.本システムを実現するために,伴奏を含む音響信号中から伴奏音の影響を低減させ歌声の特性を表現する特徴ベクトルを抽出する手法と,相互情報量を用いて2 つの特徴ベクトル列間の類似度を計算する手法を開発した.本システムを実装し,約2000曲をデータベースに登録し運用することで,システムが正しく動作することを確認した.


「ユーザ歌唱を真似て歌声合成する」
中野 倫靖、後藤 真孝

本研究では,歌声合成を使用した音楽制作を支援するために,ユーザの歌唱音声から歌声合成パラメータを自動推定するシステムVocaListener を実現した.従来,ユーザの歌唱音声から,音高や音量等を推定して歌声合成パラメータとする研究はあったが,歌声合成の条件(歌声合成システムやその音源データ) の違いに対してロバストでなく,入力歌唱を真似るだけでは,ユーザの歌唱力を超えることが出来ないという問題もあった.そこでVocaListener では,合成された歌唱が入力歌唱と近くなるように,合成パラメータを反復更新することで,上記の条件の変化へ対処する.さらに,入力歌唱に対して,音高のずれやビブラートなどの歌唱要素を修正できる支援機能も提供する.