歴史的音源アーカイブに向けたオープンコーパスの整備と AI 音声復元技術の開発
- プロジェクトリーダー
- 高道 慎之介 (東京大学)
- 実施期間
- 2022年10月~
概要
本研究の目的は、歴史的音源を現代音質に蘇らせ解析するための、オープン音声コーパスと、深層学習に基づく音声自動復元技術の開発・公開である。音声言語に関する歴史的音源 (当時の日本語話し言葉の音声など) の多くは、ディジタル化されないまま経年劣化が進み、仮にディジタル化したとしても音響的な歪みや欠落を多く含む。本研究課題では、オープンリール等に保存された東北地方 (宮城県、岩手県の一部。以下同じ) 方言を最初の例として、日本語解析に資する音声コーパスと、音声復元のための深層学習技術を開発する。前者は、歴史的音源を多数貯蔵する仙台文学館と連携し、後者は、少データからの音声復元を可能にする自己教師あり転移学習を提案する。期間終了後には、コーパスと復元技術を研究目的に限り誰でも無償で利用できる形式で公開し、歴史的音源の高品質アーカイブと解析の促進を狙う。
プロジェクトの構成員
- 歴史的音源アーカイブに向けたオープンコーパスの整備と AI 音声復元技術の開発 [ PDF | 62KB ]