Lemmatizer
Der Lemmatizer erzeugt die Grundform von Wörtern. Das Verb "does" wird zu "do", "said" wird zu "say".
Wörter in die Grundform zu überführen ist sehr nützlich, wenn wir z. B. daran interessiert sind, welche Wörter in Texten häufig verwendet werden. Sind wir beispielsweise an dem Verb "vaccinate" interessiert, dann wollen wir sowohl Treffer für "vaccinated", "vaccinates" usw. erhalten. Der Lemmatizer erledigt diese Aufgabe für uns:
Wenn der lemmatizer ausgeführt wurde, können wir anschließend das Feld lemma_
des Tokens verwenden, um die Grundform für ein Wort zu erhalten.
Last updated
Was this helpful?