第149回 NINJALコロキウム
「『日本語日常会話コーパス』(CEJC) における係り受け距離の分析」
- 開催期日
- 2025年1月21日 (火) 15:10~17:10
- 開催場所
- 対面とオンラインのどちらでも参加できる、ハイブリッド形式で開催
- 国立国語研究所 多目的室 (東京都立川市緑町10-2) 交通案内
- オンライン (Web会議サービスの「Zoom」を使用)
- 参加申し込み
- 対面 (国立国語研究所 多目的室) で参加を希望される方は、1月20日 (月) 15:00までに、来所者専用事前登録フォームからお申し込みください。
オンライン (Web会議サービスの「Zoom」) で参加を希望される方は、オンライン参加者専用事前登録フォームにてお申し込みください。
来所者専用事前登録フォームからお申し込みいただいた方には、後日、担当からメールにて、所内に入るための手続きをご案内します。 オンライン参加者専用事前登録フォームにてお申し込みいただいた方には、お申し込み後ただちに、参加に必要な情報がメールで自動送信されます。 いずれの場合にもメールでのご連絡となりますので、メールアドレスにお間違いがないか、必ずご確認くださいますようお願い申し上げます。また、参加に必要な情報が記載されたメールが、お使いのメールソフトの機能により、自動的に迷惑メールフォルダに振り分けられてしまう場合がございますので、ご注意ください。 いただいた個人情報は、個人情報保護ポリシーに則り厳正に取り扱います。 - 講師
- 松田 謙次郎 (神戸松蔭女子学院大学 教授)
- 専門領域
- 社会言語学、変異理論
- 主要業績
- 松田謙次郎. 2022. 「実時間的言語研究―その研究史, 方法と問題点―」「方言の研究」8: 261-284.
- Matsuda, Kenjiro. 2012. “What Happened to the honorifics in a local Japanese dialect in 55 years: A report from the Okazaki Survey on Honorifics.” University of Pennsylvania Working Papers in Linguistics 18(2): 49-57.
- 松田謙次郎 (編) . 2008. 『国会会議録を使った日本語研究』. 東京: ひつじ書房.
- Matsuda, Kenjiro. 1995. Variable zero-marking of (o) in Tokyo Japanese. Ph. D dissertation, University of Pennsylvania.
- 講演主旨
- このトークでは、「日本語日常会話コーパス」(Corpus of Everyday Japanese Conversation: CEJC) に付されたUniversal Dependencies (UD) によるアノテーション情報を元に算出された統語的な主要素 (head) と従要素 (dependent) 間の距離である係り受け距離 (dependency distance) の変異分析を報告する。言語横断的にツリーバンクを構築する大規模プロジェクトであるUDにより、現在世界規模でこの枠組みに従ったアノテーションの施されたツリーバンクが日本語を含む多くの言語で公開されるに至っている。従来書き言葉に偏っていたツリーバンクも、近年では話し言葉に拡張されてきており、日本語では国語研のCEJCでもこの枠組みに従ったアノテーションが施されている。CEJCは映像付きの200時間超の画期的な大規模日常会話コーパスであり、そのコアと呼ばれる20時間分のデータに対するUDのアノテーションは、話し言葉における係り受け距離を分析するのに格好のデータを提供しているものと思われる。ここでは、話者ごとの係り受け距離の平均値 (Mean Dependency Distance, MDD) を用いて、CEJCで提供されている各種メタデータ (性別、年齢層、会話形式、話者間の関係性など) との相関を検討し、BCCWJでMDDの分析を行った李・劉・小森 (2022) との比較を行う。
- 参考文献
- 大村舞・若狭絢・松田寛・浅原正幸 (2023)「UD Japanese-CEJC とその評価」「言語処理学会第29回年次大会発表論文集」pp. 749-754.
- 李文平・劉海濤・小森早江子 (2022)「統語依存関係に基づく位相研究―文章ジャンルの位相差を対象に―」「言語研究」162: 47–62.
- Dobrovoljc, Kaja (2022) "Spoken Language Treebanks in Universal Dependencies: an Overview." Proceedings of the 13th Conference on Language Resources and Evaluation (LREC 2022), pp. 1798–1806
- キーワード
- 講演会、オンライン開催、NINJALコロキウム、現代日本語、文法、文章・文体、会話・談話、情報処理、係り受け距離、CEJC
NINJALコロキウムとは
国内外の優れた研究者を講師にお招きし、日本語・言語学・日本語教育のさまざまな分野について最前線の研究成果をお話しいただく講演会です。一般に公開していますので、教員・大学院生を問わず、ご自由にご参加ください。 (参加無料)
スケジュール : 不定期。原則として、1ヶ月1回。
事前の参加申し込みが必要ですので、ご注意ください。