| 略称 | : | 合成的意味記述 |
|---|---|---|
| プロジェクトリーダー | : | 山口昌也(やまぐち まさや) (国立国語研究所 言語資源研究系 准教授) |
| 研究分野 | : | 言語学・知識情報処理 |
| キーワード | : | 自然言語処理,意味記述,文脈 |
文脈情報は,従来から,シソーラスの自動構築,多義語の曖昧性解消など自然言語処理のタスクにおいて利用されてきた。多くの研究では,「類似する文脈に出現する語は意味的にも類似している」という「分布仮説」を前提としており,文脈情報は一種の意味記述として利用されている。本研究プロジェクトでは,単語周辺の文脈情報から,複合的な言語要素(例:複合動詞)の意味記述(文脈情報)を合成的に導出する理論の確立を目指し,(1)(個々の)単語周辺の文脈情報と,複合的に用いられたときの文脈情報との関係の解明,(2)文脈情報の表現方法などを含めた分布仮説の検証,(3)自然言語処理結果の言語学的観点からの検証,を行う。
本プロジェクトは,言語学,日本語学,自然言語処理の専門家から構成される。そのため,自然言語処理の精度向上への寄与のみならず,工学の見地から国語辞典編集などへの数理的なフィードバックを期待できる。
北村雅則(南山大学短期大学部),白井清昭(北陸先端科学技術大学院大学),千葉庄寿(麗澤大学),井上優(麗澤大学),金田智子(学習院大学),佐野香織(ワルシャワ大学),柏野和佳子(国立国語研究所)
文脈情報は,従来から,シソーラスの自動構築,多義語の曖昧性解消など自然言語処理のタスクにおいて利用されてきた。多くの研究で,「類似する文脈に出現する語は意味的にも類似している」という「分布仮説」を前提としており,文脈は語に対する一種の意味記述として利用されている。
その一方で,「ジュースを飲む」と「薬を飲む」の語義を分けて考えるべきなのか,「薬を飲む」と「薬を服用する」と同義なのかといった問題に対応するためには,複合語や句,文など,複数の単語を組み合わせに対して分布仮説を適用する必要がある。
そこで,本研究プロジェクトの目的は,個々の単語周辺の文脈情報から,複合的な言語要素の意味記述を合成的に導出するための理論を確立することである。なお,本プロジェクトは,意味論研究の一つであり,理論・構造研究系と関連した研究である。また,本研究の検証には,コーパスをはじめとして,さまざまな言語資源を用いるので,言語資源研究系の研究に関連する。
本研究プロジェクトでは,上記の研究目的を達成するために,次の三つのことを行う。(1)がプロジェクトの本論,(2)(3)が本論の基礎固め,言語学・工学間のコラボレーションを担う。
まず,単語周辺の文脈情報と,複合的な言語要素の文脈情報を比較し,両者の関係を分析する。分析対象は,複合動詞とする。分析は,複合動詞と構成要素の動詞間で,構文(例:格要素),および,意味的な対応関係を比較し,構成要素の動詞の語義,格要素がどのように複合動詞に継承・変化していくかといった事柄を調査・モデル化する。また,動詞の用例をWebから大量に自動収集するとともに,構築したモデルを検証するために,複合動詞と構成要素の動詞間の意味・構文的な関係を自動獲得する。獲得した結果は,(2)(3)によっても検証される。
分布仮説を実際の言語現象に適用する方法を検証する。具体的には,「文脈」の範囲など,文脈情報を記述するための方法や,言語資料の種類や量などが結果に与える影響である。検証方法としては,(a)分布仮説を単語レベルの問題に適用した既存手法のサーベイ・追試,(b)言語学の理論に基づく分析結果(多義的な助動詞の用法分類など)との比較,(c)語義のクラスタリングなどを予定している。
分布仮説に基づいた自然言語処理結果に対して,言語学的観点から検証を行い,分布仮説の理論上・理論適用上の問題点をフィードバックする。ここでは,動詞の語義分類結果の検証(国語辞典との語義分類の比較)などを予定している。
柏野,山口は,国立国語研究所の「外来語」プロジェクトにおいて,共同研究を行った。
柏野,北村,山口は,科研費特別領域研究「日本語コーパス」では共同でコーパスの構築を行った。なお,井上,白井は,同「日本語コーパス」の分担者,千葉は連携研究者である。
北村,山口は,科研費「学習者の自発的学習と柔軟な運用を考慮した作文支援システムの実現」で共同研究を行っている。
本研究にかかわる研究成果には、次のものがある。
| 開催日時 | 開催場所 | 開催案内 | 開催概要 |
|---|---|---|---|
| 平成23年12月27日(13:30-17:30) | 国立国語研究所 | > | > |
| 平成22年12月27日(13:30-17:30) | 国立国語研究所 | > | > |
| 平成22年 7月25日(13:30-17:30) | 国立国語研究所 | > | > |
| 平成21年12月28日(13:30-17:00) | 国立国語研究所 | > | > |