コーパス開発センター

センターの紹介

コーパス開発センターは,研究系と連携して言語資源の開発整備を進め,言語資源に関する共同利用の利便性を高めることを目的としています。

具体的には,言語コーパスにくわえて,形態素解析用電子化辞書,コーパス検索ツールなどの開発を進めています。

これまでに開発してきたコーパスには,『日本語話し言葉コーパス』 (CSJ),『太陽コーパス』,『現代日本語書き言葉均衡コーパス』 (BCCWJ),『日本語歴史コーパス』 (CHJ) などがありますが,近々,200億語規模の『国語研日本語ウェブコーパス』 (NWJC) を追加する予定です。

コーパス以外の言語資源としては,日本語形態素解析用短単位辞書である UniDic,オンラインコーパス検索ツールである『少納言』,『中納言』などを開発してきました。これらの言語資源は日本語研究のインフラとして広く定着しており,2016年春の時点で1400編以上の論文において参照されていることか確認されています。

第3期中期計画期間における活動目標のひとつは,現在個別に利用されている種々のコーパスを包括的に検索することのできる検索システムを開発することです。上述のコーパス群にくわえて,今後,研究系で開発される日本語学習者コーパス,方言コーパス,日常会話コーパスなどのデータも検索対象にくわえる予定です。

  • コーパス開発センター ホームページ
    コーパス開発センター

研究者一覧

掲載はアルファベット順,「」は併任です。

専任研究者

プロジェクト研究員等

  • 加藤 祥
    (KATO Sachi)
    プロジェクト非常勤研究員
  • 近藤 明日子
    (KONDO Asuko)
    プロジェクト非常勤研究員
  • 西川 賢哉
    (NISHIKAWA Kenya)
    プロジェクト非常勤研究員
  • 能田 (竹本) 由紀子
    (NOTA (TAKEMOTO) Yukiko)
    プロジェクト非常勤研究員
  • 大村 舞
    (OMURA Mai)
    プロジェクト非常勤研究員
  • 渡邊 美知子
    (WATANABE Michiko)
    プロジェクト非常勤研究員