2011年10月15日

人間のように文章を朗読する新技術

onseigousei.jpg

東芝が、文章を感情をこめて読み上げられる音声合成技術を開発しました。
あたかも人が朗読するように小説などを読み上げることで、聞き手がより内容を深く理解したり、感情移入しやすくなるメリットがあります。

この音声合成技術の今後の展開について、考えてみましょう。


このような技術の開発は世界で初めてで、東芝は2,3年後をメドに電子書籍に搭載することを目指しています。

新技術では、「喜び」「怒り」「悲しみ」「平静」の4種類の感情別に用意した約1万の文章と照合し、読み上げる文章にこめられた感情を判別。
あらかじめプロの声優などを起用して作成した「声の辞書」から抑揚や声質、リズムが似た声を選び出し、音声を人工的に作り出しました。

さらに、タイトルや本文、箇条書きといった違いも認識し、句読点がない部分でも読むタイミングに「間」を設けたり、文脈に応じて間の長さを変える技術も開発。
これらの技術を組み合わせることで、より自然に近い表現ができるようになりました。

市販されている電子書籍の一部には朗読機能がついていますが、「棒読み」のレベルにとどまっています。
また、ビジネス書のようなものには問題はないものの、感情移入が必要な小説などには違和感がぬぐえない状態です。

電子書籍は今後の普及が期待されているものの、現状では紙媒体との明確な差別化などの問題を抱え、端末も米国ほど浸透していません。
東芝には、新技術を視覚障害者や幼児が読書する際などに役立たせることで、端末の普及を後押ししたいねらいがあるようです。
さらに、音声合成技術がすでに採用されているカーナビゲーションシステムやコールセンター分野のほか、短文投稿サイト「Twitter」の文章など、幅広い分野への応用が期待できるとみて、用途開拓に力を入れていく、としています。
このエントリーをはてなブックマークに追加

トラックバックURL

このエントリーのトラックバックURL:
http://nexus-news.net/mt/mt-tb.cgi/316