ヤマハ、新しい機械音声技術を開発

楽器・音響機器事業などを展開するヤマハは、音声対話システムにおいて、従来より人間らしく自然な機械音声での回答を可能とする技術「HEARTalk」を開発した。

HEARTalkは、話者音声の韻律(音の抑揚や強弱、高低、ピッチ、間など)をリアルタイムに解析、その音声パターンに適切な韻律になるよう合成音声を制御する。

ヤマハ 研究開発統括部 新規事業開発部 VAグループの松原弘明企画担当次長は、「従来の機械音声は調子はずれだったり、抑揚がないなど、人の声としては不自然なものが多かった」と開発の背景を説明する。カラオケの採点システムなど、同社が従来事業で積み重ねてきた音に関する研究成果を活用。発話音声と合成音声をひとつの音楽(音声)と捉え、「違和感のない音のつながり」を作成するイメージだ。なお、解析対象は音声のみで、発話内容は含まれない。



松原氏
研究開発統括部 新規事業開発部 VAグループの松原弘明企画担当次長
エレクトーンを使いながら韻律を説明した


コールセンターの応対業務や、高齢者向けのケアロボット、玩具などへの活用を想定している。音声認識/音声合成システムと連携。発話内容を音声認識によってテキスト化し、それに対する回答テキスト(FAQなど)を読み込む機械音声に適切な韻律を付加する仕組みだ(下写真参照)。

対話音声システムイメージ
HEARTalkを含む対話音声システムのイメージ

同社は、音声認識システムのフュートレック、音声合成システムを提供するNTTアイティと、HEARTalkを活用した音声対話システム(統合製品ライセンス、価格未定)の共同開発を進める。2016年内の提供開始を目指す。

このほか、HEARTalkの一部機能を切り出し、「うん」や「はい」といった“あいづち”を、発話の韻律に応じた音声で返すソフト/ハードウエアライセンスを16年夏に提供開始する予定。松原氏は「今回の協業は第1弾に過ぎない」と強調する。今後は、クラウドサービスも含み、さまざまな音声認識/音声合成システムとの連携が考えられるという。