言語処理100本ノックについて
更新履歴Permalink
2020-12-25Permalink
- 中国語版の完成
- 中国語への翻訳はRunzhe Zhanさん,Youmi Maさんにご協力頂きました.
- 日本語版におけるバグ修正
- 問題32における用語の修正(#28)
2020-06-08Permalink
- 英語版の完成
- 第5章から第10章の英訳は,清野舜さん,Benjamin Heinzerlingさん,Ana Brassardさん,Paul Reisertさんにご協力いただきました.
- 問題07の綴り間違いの修正(#12)
- 第4章において品詞タグ付け済のデータを配布(#13)
- 問題38の文面の修正(#14)
- 問題08の文面の修正(#24)
- 問題18の翻訳誤りの修正
- その他,綴り間違いやスタイルの修正
- 韓国語版の公開(39番まで翻訳完了)
- 韓国語への翻訳はSangwhan Moonさんにご協力頂きました.
- 日本語版における数多くのバグを修正
Issuesを報告して頂いた皆様,およびPull Requestsを送って頂いた皆様に感謝申し上げます.
2020-04-06Permalink
- 深層ニューラルネットワークに関する問題を追加
- 多言語対応
- 英語版の公開(39番まで翻訳完了)
- 旧第6章(英語テキストの処理)を英語版に移動
2015-03-12Permalink
- 単語の分散表現に関する問題を追加
- 利用するデータを再配布可能なものに変更
- より実践的な題材へ改訂
2012-04-03Permalink
初版を公開
配布しているデータについてPermalink
- popular-names.txt: 米国社会保障局 (SSA: Social Security Administration)のウェブサイト”Beyond the Top 1000 Names“で公開されている全州のデータを加工し,TSV形式に変換したものです.
- jawiki-country.json.gz: 2020年4月5日付けの日本語のWikipedia記事のダンプの中から,国家に言及していると思われる記事を抽出し,JSON形式で格納したものです.このファイルは,クリエイティブ・コモンズ 表示-継承 3.0 非移植のライセンスで配布されています.
- neko.txt: 青空文庫で公開されている夏目漱石の長編小説『吾輩は猫である』をテキストファイルに整形したものです.
- ai.ja.zip: 日本語Wikipediaの「人工知能」に関する記事から,テキスト部分を取り出したファイルを収録しています.このファイルは,クリエイティブ・コモンズ 表示-継承 3.0 非移植のライセンスで配布されています.
言語処理100本ノックについてPermalink
- 言語処理100本ノックの問題は,東京工業大学の岡崎直観により制作・保守されています.
- 2020年版の制作に際して,東北大学乾・鈴木研究室の清野舜さんに問題の構想と校閲,横井祥さんと高橋諒さんに問題の構想について,協力して頂きました.
- 2020年版は,清野舜さん,Benjamin Heinzerlingさん,Ana Brassardさん,Paul Reisertさん,岡崎直観によって英訳されました.
- 2020年版は,Sangwhan Moonさんによって韓国語に翻訳されました.
- 言語処理100本ノックは,2011-2012年ごろに岡崎直観によって初版が作成され,東北大学の乾・岡崎研究室(当時)(現在は乾・鈴木研究室)の新人研修の一つであるプログラミング基礎勉強会で使われてきました
- 言語処理研究を目指す学生が100問のプログラミング課題を解くという方式は,もともと名古屋大学の佐藤理史先生の研究室で行われていたものです
- 「100本ノック」という名前は,乾・岡崎研究室に在籍していた杉浦純さんが付けました
連絡先Permalink
フィードバックや助言は、GitHubレポジトリのissuesやpull requestsにお寄せ頂けますと助かります.それ以外のお問い合わせについては,nlp100
at nlp.c.titech.ac.jp
までメールでご連絡ください.