富士通ソフトウェアテクノロジーズ

Inspirium 音声合成ライブラリ ページへ

肉声韻律合成

録音ファイルから抽出した韻律を利用し、固定文を高品質に合成することができます。

固定文を高品質に合成
肉声韻律合成の実現構成

肉声韻律合成のメリット

収録音声と比較して、以下のメリットがあります。

プロナレータ不要

  • ナレータの声の変化に影響を受けない
  • 開発者によるメッセージ追加が容易

テキスト合成と自然な接続

  • 固有名詞などのテキスト合成と違和感なく接続
  • 高品質な文頭・文末により、メッセージ全体が自然

省資源化

  • データサイズは、録音音声の約50分の1

高品質音声の実現

  • 素人発音を基に、高い自然性を実現
  • 声種を変えることで、様々な合成が可能

合成方式の比較

方式 メッセージ
固有データ
波形辞書 入力文 声種
録音音声 4万4,100byte
(1秒あたり)
- 固定 固定
肉声韻律 900byte
(1秒あたり)
55~90Mbyte
(22.05kHz、女声)
固定 可変

肉声韻律合成のサンプル音声

肉声韻律合成の用途

  • 収録音声を用いたサービスの差し替えが可能
  • コールセンターのオペレーターサービス
  • 各種情報端末、自動販売機による商品、サービスの読み上げ

サンプル音声を聞くには、マイクロソフト社のWindows Media Player(無償)などが必要です。