| 略称 | : | 通時コーパス |
|---|---|---|
| プロジェクトリーダー | : | 近藤泰弘(こんどうやすひろ) 国立国語研究所客員教授 |
| 研究分野 | : | 日本語学 |
| キーワード | : | コーパス,日本語史,古典語 |
| プロジェクトのHP | : | http://historicalcorpus.jp/ |
国立国語研究所で構築する「通時コーパス」の開発に先立ち,通時コーパスを設計する基礎的な研究を行う。古代から近世までのいくつかの時点における代表的資料により,「通時コーパス」のモデルを試作しながら,次の三点を中心に研究を進め,実際に一部のコーパスの構築に着手する。
(1)どのような観点でコーパス化する資料を選定するか
(2)どのように古典本文を電子化し,どのような情報(異文・原文表記・異体字・引用・文体など)を付与するか
(3)各時代・各文体の語彙や文法に対応した形態素解析をどのように行うか
高山善行(福井大学),山元啓史(東京工業大学),岡部嘉幸(千葉大学),村上 謙(埼玉大学),山田昌裕(恵泉女学院大学),田中牧郎(国立国語研究所),小木曽智信(国立国語研究所),岡崎友子(就実大学),川村大(東京外国語大学),Bjarke Frellesvig(オクスフォード大学),Stephan Horn(オクスフォード大学),Kerri Russel(オクスフォード大学)
日本語の史的研究に用いることができる本格的な「通時コーパス」を構築する準備段階として,コーパスの設計にかかわる諸問題について研究する。①コーパスの対象に含める文献資料をどのようにして選定するか,②選定した資料をどのように電子化しどのような情報を付与するか,③古典テキストに対応した形態素解析をどのように行うかなど,通時コーパス設計のための重要問題を中心に,基礎的な研究を展開する。こうした研究は,日本語史上のいくつかの時点の主要資料についてコーパスを試作し,これを活用した日本語史研究を実践することを通して行う。 また,コーパスの構築作業における他機関との連携の可能性を探り,コーパス公開のために不可欠な著作権処理の問題についての検討も行い,通時コーパスの構築・公開に向けた諸課題に見通しを付ける。
言語資源研究系の現代語コーパスにかかわる研究と連携を取り,コーパス開発センターで実施中の現代語コーパスの構築作業,著作権処理業務などとも関連付けて研究を進めていく。
平安時代和歌,平安時代物語,鎌倉時代軍記,江戸時代洒落本などを対象とした,「通時コーパス」のモデルを試作することを通して,通時コーパス設計における重要問題について研究する。具体的には,①どのような観点で資料を選定するか,②古典本文をどのように電子化しどのような情報(異文,原文表記,異体字,引用,文体など)を付与するか,③各時代の文法・語彙に対応した形態素解析をどのように行うか,などについて,コーパスの試作と活用を通して明らかになる諸問題を解決するための検討を行うことで,通時コーパス構築のための理論的な検討を十分に重ねていく。試作したコーパスを共同研究者が活用してどのような日本語史研究が実施できるかを持ち寄って発表する研究会を重ね,コーパスを評価しつつ,本格的に構築するコーパスの設計を固めていく手順を採る。
試作する「通時コーパス」のモデルに採る古典作品の本文は,他機関が作成して公開しているものを積極的に利用し,将来的に,これらの機関と共同で研究や事業を展開していく方向を探るものとする。共同研究や共同事業の内容は,古典の本文研究,古典本文へのタグ付与や活用法の研究,著作権の処理と管理,コーパスの公開事業などを想定している。他機関としては,当面,英国オクスフォード大学を主とする。
これまで,近藤・山元・田中・小木曽は,特定領域研究「日本語コーパス」の分担者・協力者として,現代語コーパスについて共同研究を実施してきている。また,田中・小木曽は国立国語研究所で「太陽コーパス」「近代女性雑誌コーパス」など,明治・大正期のコーパスを構築し活用する研究を進めており,これに関連する科学研究費(基盤研究C,2006~2007年度)では,岡部も共同研究に参加した。
おおよその研究分担は次の通りとする(近藤は全体を統括する)が,密に連携を取り合いながら進める。
| 開催日時 | 開催場所 | 開催案内 | 開催概要 |
|---|---|---|---|
| 平成23年9月16日(13:00-16:30) | 国立国語研究所 | > | > |
| 平成23年7月31日(10:00-17:00) 平成23年8月 1日(10:00-17:00) |
大阪大学豊中キャンパス非公開 | ||
| 平成22年 9月20日(13:00-16:30) | 国立国語研究所 | > | > |
| 平成22年 3月 3日(13:30-16:30) | 国立国語研究所 | > | > |