このプロジェクトは平成24年9月で終了しました。今後の更新予定はありません。

テキストにおける語彙の分布と文章構造

略称語彙と文章構造
プロジェクトリーダー山崎 誠 (やまざき まこと)
国立国語研究所 言語資源研究系 准教授
研究分野日本語学
キーワード語彙,文章構造,結束性,レジスター

概要

従来の語彙研究は,集合論的定義に基づいた静的な存在として語彙をとらえてきた。例えば,ある調査対象について頻度表を作成したり,語種や品詞の構成比を求めたりすること等である。これらはテキストにおける時間軸 (語彙の系列) という概念を用いない分析であった。

しかし,語彙を構成する個々の語は,それぞれの文脈において使用されているのであるから,使用実態そのものを対象とした動的な語彙論が考えられる。すなわち,テキストにおける語彙の時系列的分布に基づく語彙論である。

本研究では,その一例としてテキストの産出過程とともに形成される動的な語彙を文章構造との観点から定量的に分析する。利用するデータは,コーパス開発センターで構築が進められている『現代日本語書き言葉均衡コーパス』に収録されている,ひとまとまりの完結したテキスト及び学術論文等である。これらを用いて,語彙の分布の可視的な記述方法の開発,語の使用頻度と出現状況との関係,とくに文章構造と語 (内容語,機能語) の出現状況との関係を語彙的結束性の現れという観点から探る。また,当該テキストの持つ特性 (表現意図,ジャンル,文体等) との相関を調査・分析し,語彙に内包された文章構成機能を明らかにする。