关于自然语言处理入门100练
更新日志Permalink
2020-10-29Permalink
- 完成了汉语版本的翻译工作
- 全章节的翻译由Runzhe Zhan与Youmi Ma协力完成。
2020-06-08Permalink
- 完成了英语版本的翻译工作
- 第5章到第10章的翻译由 Shun Kiyono, Benjamin Heinzerling, Ana Brassard, 与 Paul Reisert 协力完成。
- 修正了问题07中的拼写错误 (#12)
- 在第4章中增添了一个已进行词性标注的文本资料 (#13)
- 修改了问题38的描述 (#14)
- 修改了问题08的描述 (#24)
- 修正了问题18中的错误翻译
- 其他关于拼写与写作风格的修正
- 韩语翻译版本公开 (更新至问题39)
- 第1章到第4章的翻译由 Sangwhan Moon 协力完成。
- 修复了日语版本中的多个问题
我们十分感谢各位对本项目包括报告 Issues 以及提交 Pull Requests在内的各种贡献!
2020-04-06Permalink
- 增加了深度神经网络的相关问题。
- 多语言支持。
- 发布了英语翻译版本 (问题00到39)。
- 将旧版第6章(英语文本信息处理)移至英语版本。
2015-03-12Permalink
发布 自然语言处理入门100练 2015 (仅日语版).
- 增加与分布表示相关的问题。
- 公开与问题集相配套的数据。
- 围绕实践用途的NLP若干议题而修订本问题集。
2012-04-03Permalink
发布 初始第一版 (仅日语版)。
数据资源Permalink
- popular-names.txt: 由美国Social Security Administration (SSA)对Beyond the Top 1000 Names网站所公开的全国数据 进行处理并转换到TSV格式。
- enwiki-country.json.gz: 描述国家信息的文章(JSON格式)是从English Wikipedia dump2020年4月5日的存档版本中抽取的。 本文件通过Creative Commons Attribution-ShareAlike 3.0 Unported协议传播。
-
alice.zip: Lewis Carroll所著小说 “Alice’s Adventures in Wonderland“的数字文本资源来自Project Gutenberg。 请参阅
11.txt
文件获取关于Project Gutenberg License的更多信息。 - ai.en.zip: 文章”Artificial intelligence” 来自于Wikipedia英语版。该文件通过Creative Commons Attribution-ShareAlike 3.0 Unported协议传播。
关于自然语言处理入门100练Permalink
- 自然语言处理入门100练由东京工业大学的岡崎直観先生进行编制与维护。
- 编制2020版本的过程中,十分感谢东北大学乾・鈴木研究室的清野舜先生就问题构想给出建议并进行了校对工作,以及横井祥先生和高橋諒先生对问题构想提供了协力。
- 2020年的版本由清野舜先生,Benjamin Heinzerling先生,Ana Brassard,Paul Reisert先生,岡崎直観先生翻译至英文。
- 2020年的版本由Sangwhan Moon先生翻译至韩语。
- 自然语言处理入门100练,最开始由岡崎直観先生在2011-2012年编制,原本被用于东北大学乾・岡崎研究室(当时)(现在的乾・鈴木研究室)的新人研修系列活动之一,作为编程基础学习会上的指导资源。
- 通过解决100道习题帮助新生入门自然语言处理研究的形式,受到名古屋大学的佐藤理史先生的研究室中所开展的实践活动所启发。
- 「100本ノック」这个命名由目前乾・岡崎研究室所属的杉浦純先生所提出。
联络方式Permalink
我们欢迎任何在GitHub上对本项目以 issues 与 pull requests 形式提出的反馈或建议。除此之外,关于其他的咨询与联络请寄送电子邮件到 nlp100
at nlp.c.titech.ac.jp
。