このプロジェクトは平成24年9月で終了しました。今後の更新予定はありません。
文脈情報に基づく複合的言語要素の合成的意味記述に関する研究 プロジェクトの詳細
研究目的
文脈情報は,従来から,シソーラスの自動構築,多義語の曖昧性解消など自然言語処理のタスクにおいて利用されてきた。多くの研究で,「類似する文脈に出現する語は意味的にも類似している」という「分布仮説」を前提としており,文脈は語に対する一種の意味記述として利用されている。
その一方で,「ジュースを飲む」と「薬を飲む」の語義を分けて考えるべきなのか,「薬を飲む」と「薬を服用する」と同義なのかといった問題に対応するためには,複合語や句,文など,複数の単語を組み合わせに対して分布仮説を適用する必要がある。
そこで,本研究プロジェクトの目的は,個々の単語周辺の文脈情報から,複合的な言語要素の意味記述を合成的に導出するための理論を確立することである。なお,本プロジェクトは,意味論研究の一つであり,理論・構造研究系と関連した研究である。また,本研究の検証には,コーパスをはじめとして,さまざまな言語資源を用いるので,言語資源研究系の研究に関連する。
研究計画・方法
本研究プロジェクトでは,上記の研究目的を達成するために,次の三つのことを行う。(1) がプロジェクトの本論,(2) (3) が本論の基礎固め,言語学・工学間のコラボレーションを担う。
(1) 文脈情報に基づく複合的な言語要素の意味記述 (担当 : 山口)
まず,単語周辺の文脈情報と,複合的な言語要素の文脈情報を比較し,両者の関係を分析する。分析対象は,複合動詞とする。分析は,複合動詞と構成要素の動詞間で,構文 (例 : 格要素),および,意味的な対応関係を比較し,構成要素の動詞の語義,格要素がどのように複合動詞に継承・変化していくかといった事柄を調査・モデル化する。また,動詞の用例を Web から大量に自動収集するとともに,構築したモデルを検証するために,複合動詞と構成要素の動詞間の意味・構文的な関係を自動獲得する。獲得した結果は,(2) (3) によっても検証される。
(2) 分布仮説の適用方法の検証 (担当 : 北村,白井)
分布仮説を実際の言語現象に適用する方法を検証する。具体的には,「文脈」の範囲など,文脈情報を記述するための方法や,言語資料の種類や量などが結果に与える影響である。検証方法としては,(a) 分布仮説を単語レベルの問題に適用した既存手法のサーベイ・追試,(b) 言語学の理論に基づく分析結果 (多義的な助動詞の用法分類など) との比較,(c) 語義のクラスタリングなどを予定している。
(3) 自然言語処理結果の言語学的観点からの検証 (担当 : 井上,柏野,千葉)
分布仮説に基づいた自然言語処理結果に対して,言語学的観点から検証を行い,分布仮説の理論上・理論適用上の問題点をフィードバックする。ここでは,動詞の語義分類結果の検証 (国語辞典との語義分類の比較) などを予定している。
連携状況
柏野,山口は,国立国語研究所の「外来語」プロジェクトにおいて,共同研究を行った。
柏野,北村,山口は,科研費特別領域研究「日本語コーパス」では共同でコーパスの構築を行った。なお,井上,白井は,同「日本語コーパス」の分担者,千葉は連携研究者である。
北村,山口は,科研費「学習者の自発的学習と柔軟な運用を考慮した作文支援システムの実現」で共同研究を行っている。
研究成果
本研究にかかわる研究成果には、次のものがある。
共同研究員 (所属)
平成24年9月時点の所属です。
- 井上 優(麗澤大学)
- 金田 智子(学習院大学)
- 北村 雅則(南山大学短期大学部)
- 佐野 香織(ワルシャワ大学)
- 白井 清昭
(北陸先端科学技術大学院大学) - 千葉 庄寿(麗澤大学)
- 柏野 和佳子(国立国語研究所)