現代日本語

現代の標準日本語に関連する資料です。

  • 現代日本語書き言葉均衡コーパス (BCCWJ)

    現代日本語の書き言葉の多様性を把握するために構築したコーパスで,書籍,雑誌,新聞,白書,Web,法律などから無作為に抽出した約1億語のテキストに形態論情報,文書構造タグを付与し,オンラインおよびDVDで公開しています。

  • BCCWJ 全文検索サイト『少納言』

    国立国語研究所で開発されたWeb アプリケーションで,初心者でも簡単に BCCWJ 内の文字列を検索することができます。

  • NINJAL-LWP for BCCWJ (NLB)

    『現代日本語書き言葉均衡コーパス』 (Balanced Corpus of Comtemporary Written Japanese: BCCWJ) を検索するために,国語研と Lago言語研究所が共同開発したオンライン検索システムです。

  • 日本語話し言葉コーパス (CSJ)

    『日本語話し言葉コーパス (Corpus of Spontaneous Japanese: CSJ) 』は,日本語の自発音声を大量にあつめて多くの研究用情報を付加した話し言葉研究用のデータベースであり,国立国語研究所,情報通信研究機構 (旧通信総合研究所),東京工業大学が共同開発した,質・量ともに世界最高水準の話し言葉データベースです。
    本コーパスは,音声言語情報処理,自然言語処理,日本語学,言語学,音声学,心理学,社会学,日本語教育,辞書編纂など幅広い領域で利用されています。

  • 国語研日本語ウェブコーパス

    3か月間にわたり1億 URL をクロールして構築した200億語規模の Web テキストのコーパス。形態素解析・係り受け解析済みテキストからなる。

  • 名大会話コーパス

    129会話,合計約100時間の日本語母語話者同士の雑談を文字化したコーパスです。

  • コーパス検索アプリケーション『中納言』

    国立国語研究所で開発されたコーパスを検索することができる Web アプリケーションで,短単位・長単位・文字列の3つの方法によってコーパスに付与された形態論情報を組み合わせた高度な検索を行うことができます。

  • Webデータに基づく用例データベース (複合動詞サ変動詞形容詞)

    本データベースは,複合動詞,形容詞,サ変動詞の用例のデータベースである。用例は,語ごとに構築した専用の Webコーパスから行っている。構築に際しては,(1)語ごとに一定量以上の用例を収集できること,(2)収集用例の偏りの軽減に配慮している。

  • 『分類語彙表 増補改訂版』研究用データ

    分類語彙表とは,「語を意味によって分類・整理したシソーラス (類義語集) 」です。
    本データベース版は,書籍版の『分類語彙表 ―増補改訂版―』の元となったデータを加工したものです。データベースソフトに取り込めるよう CSV 形式になっています。レコード総数は,101,070件です。

  • 現代雑誌200万字言語調査語彙表

    2001年から2004年にかけて行われた「現代雑誌の語彙調査 ―1994年発行70誌―」の調査結果の語彙表。

  • 「学校の中の敬語」アンケート調査データ

    国立国語研究所が1989年から1990年にかけて中学生・高校生を対象に実施した敬語使用と敬語意識に関するアンケート調査で得られたデータです。中学生は東京2,456名,山形339名,高校生は東京2,222名,大阪1,004名が回答しています。

  • 形態素解析ツール Web茶まめ

    各種のUniDicを使って形態素解析を行うためのツールです。形態素解析に必要な一連の作業をWeb上でわかりやすいインターフェイスによって行うことができます。

  • 複合動詞レキシコン (国際版)

    「押し上げる,晴れ渡る」など,日常よく使われる日本語複合動詞 (2,700語以上) に意味や用法の情報を付与した言語研究及び日本語学習用のオンライン辞書。英語・中国語・韓国語翻訳付き。研究教育目的での元データのダウンロードも可能。

  • 使役交替言語地図

    世界の言語の形態的関連のある有対動詞を収集した地理類型論的なデータベースです。
    日本語を含む諸言語の有対自他動詞の類型論的な情報を,世界地図およびチャート (表) 上で可視化し,有対自他動詞を類型論的な視点から分析できるウェブアプリケーションです。

  • 統語・意味解析情報付き現代日本語コーパス (NPCMJ)

    現代日本語の書き言葉と話し言葉のテクストに対し文の統語・意味解析情報をタグ付けしたものです。どなたでも簡単にコーパス内のツリー (統語構造付き文) を検索,閲覧,ダウンロードしていただけるウェブインターフェースとともに公開しています。

  • UniDic

    形態論情報を付与した語彙資源です。形態素解析器 MeCab のモデルを同梱しています。

  • X線映画「日本語の発音」

    日本語発音時の調音運動を撮影したX線映画 (1965年,1967年撮影)

  • 寺村秀夫連体修飾論文英訳集

    このサイトでは,1970年代から1980年代にかけて日本語学・日本語教育の学術的基盤を築くのに大きく貢献した故・寺村秀夫教授 (1928–1990) が残した学術論文の幾つかを英語に翻訳して提供します。