統語解析

文の構文を解析するのが統語解析あるいは構文解析 (syntactic analysis) である。 文節の係り先を解析することになるので、係り受け解析とも呼ばれる。 統語構造を解析することは意味を解析する第一歩ともなる。

統語解析システム

統語解析システムを用いると、文節の係り先を知ることができる (よって、統語解析システムは係り受け解析器とも呼ばれる)。 通常、係り受け関係は木構造で表現することが可能である。

動詞がどの句を下位範疇化しているか (その動詞に対応する格要素となっているか) がわかることは、意味の解析上重要である。

日本語統語解析システムのリスト

統語解析システムのうち、日本語に対応していて、 フリーソフトウェアのものを挙げる。

CaboCha
精度の高い統語解析システム。形態素解析システム MeCab とともに用いる。
CaboCha のインストールと使用方法
KNP (黒橋-長尾 Parser)
日本語統語解析システムの先駆け。形態素解析システム JUMAN とともに用いる。

本体がフリーソフトウェアであっても、 学習に用いたコーパスのライセンスは異なる場合があるので注意が必要である。

補足

日本語は格要素が省略可能なため、 統語解析をしても動作主や対象などが定まらないことが多い。 例えば、英語では他動詞であれば目的語を省略することはできないが、 日本語では省略できる。