Fujitsu The Possibilities are Infinite

 

 Newテクノロジー(1) |  Newテクノロジー(2) |


Newテクノロジー(1)
携帯電話のユニバーサルデザインを目指して
‐音声処理技術と手ぶれ補正技術‐

PDFダウンロード(1.49MB)

携帯電話はいまや一人1台が当たり前の時代になり、子供や高齢者の利用も急速に伸びています。富士通は株式会社エヌ・ティ・ティ・ドコモ様の主要ベンダーとして、サービス開始当初から携帯電話機を継続的に市場に投入してきており、長年培ってきたあらゆる技術を適用しながら、使いやすさの向上を目指してきました。今回は、富士通の携帯電話に搭載されている様々な技術の中から、相手の声を聞きやすくする音声処理技術と、写真撮影時の手ぶれを自動的に補正する画像処理技術をご紹介します。


携帯電話は屋外の様々な場所でも利用されますが、周囲の騒音によっては相手の声が聞きにくくなる場合があります。また、相手の話し方によっては早口と感じて、うまく聞き取れないこともあります。富士通研究所では、携帯電話を利用される方に相手の声をさらに聞きやすくする独自の会話支援機能として、次の2つの音声処理技術を開発しました。

声の高さを変えず速さを変える「ゆっくりボイス」

「ゆっくりボイス」は、相手の声を受信側でゆっくり出力させることで聞きやすさを向上した話速変換技術です。株式会社エヌ・ティ・ティ・ドコモ様の「らくらくホン」シリーズに搭載されているこの技術は、次の3つの技術によって実現されています。
第1に、ゆっくり出力させても声の高さを変えない「音声伸長技術」です。声の波形には一定の周期長(ピッチ)があり、これが変わると声の高さも変わります。周期長を単純に引き伸ばせば遅くできますが、ちょうどテープを遅回ししたように、実際よりも声が低くなって別人のように聞こえてしまいます。そこで、周期長は保って声の高さを変えず、ピッチを繰り返すようにしました。ただし繰り返す場合も、直前の音声波形と最も自然につながる接続点を探索し、類似度の高い波形領域だけを繰り返すことによって、劣化の少ない音声伸長を実現しています。
電話は双方向通信ですから、一方でどんどん遅らせてしまうとスムーズな会話を楽しむことができません。そこで、第2として時間の“ずれ”を抑える「遅延制御技術」が必要になります。これは、発話の中の無音を使って、声の始まりをできるだけ揃える技術です。例えば「もしもし山田ですまた明日電話しますよろしく」という発話の中には、「もしもし(無音)山田です(無音)また明日電話します(無音)よろしく」といったように無音が隠れています。無音といっても周囲の雑音は入りますので、適確に音声のない区間として捉えるのが、第3の「無音検出技術」です。さらに、たとえ無音がない場合でも、音声伸長によって会話に支障がでないよう、“ずれ”が一定時間以上になると少しずつ元の速さまで回復し、受信した音声は全て出力していくといった工夫が施されています。

[図1]「ゆっくりボイス」の話速変換技術

音声の明瞭度を高める「はっきりボイス」

「はっきりボイス」は、周囲が騒がしい時に相手の声を強調して聞きやすくする音声処理技術です。
音声を周波数と電力の関係で表すと、複数の山を持つ波のような形になります。電力値が大きいほど聞きやすくなりますが、周囲が騒がしくなると、雑音よりも電力値の小さい音声の部分が埋もれて聞きにくくなります。一般に音声は周波数が高くなるにつれて電力が小さくなる傾向があるので、高い周波数成分ほど雑音に埋もれやすくなります。そこで、高い周波数を中心に音声の聞きやすさに貢献する成分を適切に増幅させることにより、音声の明瞭度を向上させています。
「聞きやすい音声」は、人それぞれ異なりますから、幅広い年代のユーザーによる聞き比べ実験を行い、多くのユーザーが聞きやすいと感じることを確認しました。

[図2]「はっきりボイス」の音声処理技術

ユビキタスに関連する記事


ジャーナル最新のテーマ

今月のテーマ:新世代ERP 迅速な経営判断と戦略展開を支援します 続きを読む


今月のアンケート 第2回集計結果公開中 情報の「見える化」による予測の実現を望む声多数 2009年11月17日集計 気になる結果は?


お客様の声をお聞かせください

富士通ジャーナルに掲載している記事やコンテンツについてのご意見・ご感想を、ぜひお寄せください。

ご意見・ご感想フォーム いただいた、お客様の声


お寄せいただいたご意見・ご感想については、富士通からの回答をお約束するものではありません。ご了承ください。
なお、富士通からのご回答を必要とするお問い合わせについては、
富士通ジャーナルに関するお問い合わせをご利用ください。