国立国語研究所では、明治から現代にいたる日本語の全貌を把握するための言語コーパスKOTONOHAを構築しています。2006年度から5年間は、現代日本語の書き言葉を対象としたコーパスの構築を進めます。本サイトでは、この書き言葉コーパスについて説明します。

Whats's New
モニター公開データ利用者アンケート (2010.07.25)
モニター公開データの利用者の方を対象に利用実態アンケートを実施しています。(2010年7月31日締め切り)
報告書の追加 (2010.04.14)

KOTONOHA計画に関する報告書を追加しました。申し込み制です。こちらをご覧下さい。

検索デモンストレーションサイトへのデータ追加 (2010.03.08)
「現代日本語書き言葉均衡コーパス」の検索デモンストレーションのサイトにデータを追加しました。検定教科書(約100万語)とYahoo!ブログ(約500万語)が追加されました。 是非おためし下さい。
サイトはこちら

公開ワークショップの御案内 (2010.02.10)
特定領域研究「日本語コーパス」の公開ワークシップ(研究成果報告会)を以下の日程で開催します。初日の3月14日にはモニター公開データを利用した研究発表があります。
2010年3月14日(日) 国立国語研究所
     3月15日(月)・16日(火) 東京工業大学・大岡山キャンパス
詳しくは以下のサイトをご覧ください。
特定領域研究「日本語コーパス」平成21年度公開ワークショップ
メディアでの報道
教育とICT Online (2010.02.22)
「人知の限界」を補う 一億語の日本語データベース
IT Media (2008.04.23)
「w」(ワラ)の意味も解析!?――NIIと国語研、Yahoo!ブログの記事を学術利用
IT Pro (2008.04.23)
NIIと国語研、Yahoo!ブログのデータを研究用途で無償提供
Internet Watch (2008.04.23)

現代日本語の研究などに「Yahoo!ブログ」の記事を収集・提供へ

 

東京MXテレビ, 「ガリレオチャンネル」 (2008.02.10)
東京MXテレビ, 「ガリレオチャンネル」2008年2月10日「言葉の壁を越えて:音声翻訳技術が世界を変える」
ご協力をいただいている機関・会社

現代日本語書き言葉均衡コーパスの構築にあたっては、以下の各機関・会社の御理解を得て、データの提供等のご協力をいただいています。

国立国会図書館、東京都立中央図書館、東京都立日比谷図書館、東京都立多摩図書館、立川市図書館、八王子市図書館、横浜市中央図書館、埼玉県立久喜図書館、埼玉県立浦和図書館、埼玉県立熊谷図書館、大阪市立中央図書館、一橋大学附属図書館、自治大学校図書室、(社)日本図書館協会、(株)読売新聞社、(株)朝日新聞社、(株)毎日新聞社、(株)産経新聞社、(株)北海道新聞社、(株)中日新聞社、(株)西日本新聞社、 (株)河北新報社、(株)新潟日報社、(株)京都新聞社、(株)神戸新聞社、(株)中国新聞社、(株)高知新聞社、 (株)琉球新報社、(社)共同通信社、(株)時事通信社、ヤフー(株)、(株)小学館、(社)日本文藝家協会、 (社)日本推理作家協会、(社)日本児童文学者協会、(社)日本児童文芸家協会、(社)日本ペンクラブ、(社)教科書協会、一般社団法人教学図書協会

検索デモンストレーション

著作権者の方々から許諾をいただいたサンプルがどのように利用されるかを理解していただくために「検索デモンストレーションサイト」を開設しています。詳しくは以下のアドレスをご参照ください。

http://www.kotonoha.gr.jp/demo/