Week3
構文解析
- 目的: 文の文法的な構造を定め、後続する処理の入力とする
- 大きく二つのやり方
- 構文解析器のことをパーサ (parser) と呼ぶ
- nltk demo:
nltk.app.rdparser_app.app()
- 構文的曖昧性 (syntactic ambiguity)
- 日本語係り受け解析
まとめ
- 構文解析の役割: 自然言語文の意味は、構成要素である単語の保つ意味が文の持つ構造によって組合わされることによって定まると考える (構成性の原理) と、文の構造を明らかにする構文解析は重要な処理である
- 構文解析の方式: 句構造解析と依存構造解析
機械翻訳
まとめ
- 機械翻訳は自然言語処理の中心的応用の一つであり、多くの要素技術の進展を牽引してきた
- 依然として (おそらく) 規則に基づく MT や統計翻訳は利用されているが、技術の主流は完全にニューラル翻訳に移っている
- ただし、ニューラル翻訳には特有の落とし穴もあるので注意が必要…
NLP の方法論: 全体のまとめ
- 理性的アプローチから経験主義的 (データ駆動) アプローチへ
- end-to-end アプローチの一般化
- 入出力のデータが十分にあるならば、ニューラルネットワークによる end-to-end アプローチが有効
- 精度がよい (ことが多い)
- モジュール化に伴うエラー伝搬がない
- 処理がブラックボックス (解釈性, 説明可能性の問題)
- ちょっとした手直しやチューニングが困難