このプロジェクトは平成24年9月で終了しました。今後の更新予定はありません。
テキストにおける語彙の分布と文章構造 プロジェクトの詳細
研究目的
本研究は,コーパス開発センターで構築が進められている『現代日本語書き言葉均衡コーパス』に収録されているひとまとまりの完結したテキスト (複数) 等を対象にして,語 (内容語及び機能語) の出現状況と時間軸に沿って展開される文章の流れとを有機的に関連付けて動的に捉える観点を提案し,計量語彙論に基づく定量的手法と,語の出現状況及び文章構造・文章展開のモデル化とを通してより実証的な文章論を開拓するものである。
語彙調査に代表される従来の計量語彙論は,断片的なテキストの集合を扱っていたため,文脈から切り離された分析が中心であった。そのため,文章展開や文章構造など,まとまりのある文章が持つ特徴との関係を把握することが出来なかった。本研究では,テキストにおける語彙の量的構造と文章構造及び当該テキストの持つ特性 (表現意図,ジャンル,文体等) との相関を調査・分析し,語彙に内包された文章構成機能を明らかにする。
研究計画・方法
平成21年度 (準備的研究)
- 『現代書き言葉均衡コーパス』等のデータから,分析に利用するテキストを抽出し,形態素解析を施す。 (山崎)
- 文章展開にかかわる語 (自立語,機能語) についてどのような立場からの研究ができるか検討する。 (全員)
平成22~23年度
山崎,大塚は内容語について,江田,清水,馬場 (俊) は機能語について,それぞれ文章構成機能と関連づけた分析を行う。高崎は,両者の中間的存在である談話構成語とレジスターとの関係を中心とした分析を行う。金,馬場 (康) は,語彙の分布の統計的表現方法について検討を行う。
- テキストにおける語 (主として多義語) の出現状況と語彙的結束性との関係の調査・分析 (山崎)
- 初級教科書に現れる文法形式が表す文章構成機能の調査分析 (江田)
- 学術論文における構成要素 (引用・判断表現・メタ言語表現等) 間の結びつきの調査と構成要素の持つ論文の展開機能の分析 (清水)
- 多義語の語義構造および語義の識別と,テキストにおける出現パターンとの関連について調査と分析 (大塚)
- 語彙分布の統計性質とそのモデル化の検討 (金,馬場 (康) )
- 文章構造・文章ジャンルと特徴的な接続表現類との関係の分析 (馬場 (俊) )
- 複合辞等の機能語の分布とテキストのジャンルの関係の分析 (村田)
平成24年度
内容語の分析と機能語の分析を総合し,文章中の全語彙の文章展開や文章構造とのかかわりを明らかにする。
- 文章展開や文章構造の類型に関与する語彙と関与しない語彙の特徴の記述分析 (山崎,大塚,村田,馬場 (俊) ,江田,清水)
- 談話構成語50語のリストを作成し,その各語についての国語辞典的語釈説明と談話構成機能との関連を探り,内容語が談話機能を獲得するプロセスのパターン化を試みる。 (高崎)
- 文章展開のパターンの統計分析とそのモデル化 (金,馬場 (康) )
- 報告書の刊行 (全員)
共同研究員 (所属)
平成24年9月時点の所属です。
- 江田 すみれ(日本女子大学)
- 大塚 みさ(実践女子短期大学)
- 金 明哲(同志社大学)
- 清水 まさ子(国際交流基金)
- 高崎 みどり(お茶の水女子大学)
- 馬場 俊臣(北海道教育大学)
- 馬場 康維(統計数理研究所)
- 村田 年(慶應義塾大学)