B-JAS データ配布サイト
お知らせ
2026年3月11日
「非対面調査データ」の作文データをUTF-8(BOM無)に統一しました。
2024年9月14日
NINJAL国際シンポジウム 「北京日本語学習者縦断コーパス (B-JAS) が拓く日本語教育の未来」を開催します。
詳細は
こちら(国語研サイト内)
2024年7月30日
データバージョンを2024年3月バージョンに差し替えました(B-JAS中納言に対応したデータとなります)。
2023年3月14日
第45回NINJALチュートリアルを開催します。
詳細は
こちら(国語研サイト内)
2023年3月
B-JASのテキストデータ・音声データを公開しました。
概要・タスク説明
日本語を勉強している中国語母語の大学生の発話及び作文データを、4年間にわたって
収集した縦断コーパスです。
大規模横断コーパスI-JASと対応するコーパスで、対話だけでなく、ロールプレイや
ストーリーテリングなど、様々なタスクのデータを収集しています。
下記、データの概要や利用規約などを必ずお読みになったうえでご利用ください。
利用規約は、ご利用の前に必ずお読みください。こちらからダウンロード
【B-JAS_利用規約.pdf】
データの概要・タスクの説明はここからダウンロード
【B-JAS概要・タスク説明・文字化概要.docx】
本データを研究に利用し成果を公表する場合は、必ず「北京日本語学習者横断コーパス:B-JAS」を
利用した旨を記述し、下記にご連絡ください。(記述例は利用規約をご覧ください)
【公表情報送付先】
国立国語研究所 日本語教育 B-JASプロジェクト
メールアドレス:discourse-info(at)ninjal.ac.jp
*(at) は @ に置き換えて下さい
*メールの件名に【B-JAS】と付与のうえ、ご送信ください。
件名例)【B-JAS】研究成果に関するご報告
背景調査
背景調査(フェイスシート)はここからダウンロード
【B-JAS_背景調査.xlsx】
B-JASデータ データバージョン2024.03
*データの容量がかなり大きいので、ご自身のインターネット環境に注意してダウンロードしてください。
語数表
tsvファイル
xlsxファイル
対面調査データ
文字化データ
【B-JAS_対面調査_文字化データ.txt】  2MB
音声データ
【B-JAS_対面調査_音声データ_Ⅰ.mp3】 4.5GB
【B-JAS_対面調査_音声データ_D・RP・ST.mp3】 2.2GB
ストーリーライティングデータ 作文データ
【B-JAS_対面調査_SWデータ.txt】 0.2MB
非対面調査データ
作文データ
【B-JAS_非対面調査データ_作文データ.txt】0.6MB