国立国語研究所では、明治から現代にいたる日本語の全貌を把握するための言語コーパスKOTONOHAを構築しています。2006年度から5年間は、現代日本語の書き言葉を対象としたコーパスの構築を進めます。本サイトでは、この書き言葉コーパスについて説明します。

Whats's New
「コーパス日本語学ワークショップ」開催と研究発表募集のお知らせ (2011.11.02)
国立国語研究所言語資源研究系ではこのたび「コーパス日本語学ワークショップ」を開催することになりました。このワークショップは現在国立国語研究所言語資源研究系で進められている各種共同研究プロジェクトの成果を公開形式で報告するとともに、研究発表を広く一般公募することによって、コーパス日本語学ないし日本語言語資源研究の開かれた研究交流の場を提供しようとするものです。詳しくは、こちらのページをご覧ください。
BCCWJオンライン公開のお知らせ (2011.08.08)
『現代日本語書き言葉均衡コーパス』(Balanced Corpus of Contemporary Written Japanese、略称 BCCWJ)が完成し、オンライン公開を開始しました。BCCWJは日本で最初の本格的な書き言葉の均衡コーパスです。日本語学、日本語教育はもとより、さまざまな分野での応用が期待されます。ぜひご利用下さい。詳しくは「データ公開方式」のページをご覧下さい
「中納言」を公開しました (2011.08.04)
形態論情報による検索ができる「中納言」を公開しました。 ご利用にあたってはお申し込みが必要です。 くわしくは中納言のサイトをご覧下さい。
検索デモンストレーションサイトの名称変更のお知らせ (2011.07.22)
「現代日本語書き言葉均衡コーパス」検索デモンストレーションのサイトは、名称を「少納言」と改めました。 サイトはこちらです。
メディアでの報道
教育とICT Online (2010.02.22)
「人知の限界」を補う 一億語の日本語データベース
IT Media (2008.04.23)
「w」(ワラ)の意味も解析!?――NIIと国語研、Yahoo!ブログの記事を学術利用
IT Pro (2008.04.23)
NIIと国語研、Yahoo!ブログのデータを研究用途で無償提供
Internet Watch (2008.04.23)

現代日本語の研究などに「Yahoo!ブログ」の記事を収集・提供へ

 

東京MXテレビ, 「ガリレオチャンネル」 (2008.02.10)
東京MXテレビ, 「ガリレオチャンネル」2008年2月10日「言葉の壁を越えて:音声翻訳技術が世界を変える」
ご協力をいただいている機関・会社

現代日本語書き言葉均衡コーパスの構築にあたっては、以下の各機関・会社の御理解を得て、データの提供等のご協力をいただいています。

国立国会図書館、東京都立中央図書館、東京都立日比谷図書館、東京都立多摩図書館、立川市図書館、八王子市図書館、横浜市中央図書館、埼玉県立久喜図書館、埼玉県立浦和図書館、埼玉県立熊谷図書館、大阪市立中央図書館、一橋大学附属図書館、自治大学校図書室、(社)日本図書館協会、(株)読売新聞社、(株)朝日新聞社、(株)毎日新聞社、(株)産経新聞社、(株)北海道新聞社、(株)中日新聞社、(株)西日本新聞社、 (株)河北新報社、(株)新潟日報社、(株)京都新聞社、(株)神戸新聞社、(株)中国新聞社、(株)高知新聞社、 (株)琉球新報社、(社)共同通信社、(株)時事通信社、ヤフー(株)、(株)小学館、(社)日本文藝家協会、 (社)日本推理作家協会、(社)日本児童文学者協会、(社)日本児童文芸家協会、(社)日本ペンクラブ、(社)教科書協会、一般社団法人教学図書協会

検索デモンストレーション

著作権者の方々から許諾をいただいたサンプルがどのように利用されるかを理解していただくために「検索デモンストレーションサイト」を開設しています。詳しくは以下のアドレスをご参照ください。

http://www.kotonoha.gr.jp/demo/