大規模日常会話コーパスに基づく話し言葉の多角的研究

略称
日常会話コーパス
プロジェクトリーダー
小磯 花絵 (国立国語研究所 音声言語研究領域 准教授)
キーワード
話し言葉コーパス,会話分析
関連サイト
プロジェクトのウェブサイト

概要

研究目的

日常会話は私たちが社会生活を送る上での基盤の一つです。会話の中に現れる話し言葉の特徴や,会話が円滑に進められるメカニズムを明らかにすることは,言語研究の中でも重要な位置を占めています。

日常会話の実態を多角的に検討するには,さまざまな場面における日常会話を収録した話し言葉コーパスが不可欠です。これまで,いくつかの日本語会話コーパスが作られてきましたが,話者や場面などに偏りがあり,多様な日常会話をカバーする会話コーパスは存在しませんでした。

そこで本プロジェクトでは,さまざまなタイプの日常会話200時間をバランス良く収録した大規模な日常会話コーパスを構築します。調査者は立ち会わず,生活の中で生じる会話を会話者自身に収録してもらうことで,日常会話をより自然な形で記録する点に特色があります。約250人を対象に1日の会話行動を追跡した会話行動調査を行ったところ,私たちが日常の中で会話をする相手・場所・形式・人数・長さなどの実態が明らかになりました。この調査結果を参考に多様な日常会話をバランス良く収録した会話コーパスを構築していきます。

言葉や行動様式は時代とともに変化するものです。本プロジェクトで構築する会話コーパスは,後世の人々が21世紀前半の日本人の言語生活や行動様式を知るための貴重な記録となるでしょう。民俗文化的価値のある日常会話を記録・保存・公開することは,この時代に生きる我々に課された重要な課題と言えます。

研究計画・方法

本プロジェクトでは,大規模な日本語日常会話コーパスを構築し,それに基づく多角的な分析を通して,話し言葉の特性をさまざまな観点から研究します。そのために,コーパス構築班と3つの研究班という体制を組織します。

会話コーパス構築班では,前述の会話行動調査の結果に基づき,さまざまな場面 (自宅・職場・店舗・屋外など) における,さまざまな相手 (家族・友人・同僚・店員など) との日常会話200時間を対象に,その映像と音声を収録します。収録した会話音声は文字化した上で,形態論情報や統語情報,発話単位,談話構造情報などのアノテーション (情報付与) を行い,検索可能な形に整備して,一般に公開します。

レジスター班では,日常会話や独話だけでなく,シナリオや小説の会話文など書かれた話し言葉をも含む多様な言語使用域 (レジスター) の話し言葉を比較し,語彙・文法・韻律などの特性を探ります。相互行為班では,会話コーパス構築班と共同で談話行為などの高次のアノテーションを行うとともに,構築する日常会話コーパスを用いて会話相互行為の中で文法の果たす役割を分析します。経年変化班では,約50年前に録音された音声資料をデータベース化して公開し,過去50年間の話し言葉にどのような変化があったかを研究します。