コーパスアノテーションの基礎研究
略称 | : | アノテーション |
---|---|---|
プロジェクトリーダー | : | 前川 喜久雄 (まえかわ きくお) 国立国語研究所 言語資源研究系 教授 |
実施期間 | : | 平成21年10月~平成28年3月 |
研究分野 | : | 言語学,知能情報処理 |
キーワード | : | コーパス,アノテーション |
概要
- 目標:既存のコーパスをより高度に活用するために必要とされる研究用付加情報 (アノテーション) の基礎研究をおこなう。
- 方法:述語項構造,節境界,各種語義タグ,事実性 (モダリティ),複合辞タグなどについてタグの仕様を検討するとともに,既存のコーパスを用いたタグ付与実験を行い,自動アノテーションの可能性についても検討する。基本的に書き言葉コーパスを対象とするが,話し言葉のアノテーションについても検討する。
- 期待される成果:日本語の高水準アノテーションの標準化をめざす。
- プロジェクトの詳細
- プロジェクトの成果物 :
- 「アノテーションデータの公開 (随時更新中)」
- 『コーパスへの意味・談話情報のアノテーション』 福原裕一,乾健太郎 [ PDF | 576KB ]
- 『モダリティタグ付きコーパスの特徴分析』 成田和弥,福原裕一,乾健太郎 [ PDF | 946KB ]