テキスト読み上げのための読みの曖昧性の分類と読み推定タスクのデータセットの構築
- プロジェクトリーダー
- 新納 浩幸 (茨城大学)
- 実施期間
- 2022年10月~
概要
近年、AI アシストのようなアプリで利用される音声合成の技術の必要度が高まっている。その技術の課題として読みの曖昧性解消がある。読みの曖昧性には、音読み訓読みの曖昧性や助数詞による数値の読みの曖昧性や同形異音語の曖昧性などいくつかのタイプが存在する。
本研究は読みの曖昧性を持つ語句を辞書やコーパスから収集し分類整理する。また文脈依存の読みの曖昧性を持つ単語を対象に、読み推定のタスクのデータセットを構築する。更に読みの推定システムを構築し、先のデータセットに対してのベースラインのスコアを示すとともに、本技術の課題について考察する。また最終的には通常のテキストから読み上げ用のテキストへの変換システムを作成し、テキスト読み上げシステムを構築する。
本システムは日本語漢字に自動的にルビを付与することも可能であり、日本語教育ツールとしても利用できる。
プロジェクトの構成員
- テキスト読み上げのための読みの曖昧性の分類と読み推定タスクのデータセットの構築 [ PDF | 153KB ]