Natural Language Processing

Aus AnthroWiki
(Weitergeleitet von Computerlinguistik)

Natural Language Processing (NLP) ist ein Teilgebiet der künstlichen Intelligenz (KI), das sich mit der Verarbeitung von menschlicher Sprache befasst. Das Ziel von NLP ist es, Computer dazu zu bringen, menschliche Sprache zu verstehen, zu analysieren und zu generieren. NLP überschneidet sich mit der Computerlinguistik (CL) oder linguistische Datenverarbeitung (LDV), die dafür die notwendigen theoretischen Grundlagen liefert.[1] Die Computerlinguistik beschäftigt sich mit der Entwicklung von Sprachmodellen und Theorien zur Beschreibung der Struktur und Bedeutung von Sprache, während NLP diese Modelle und Theorien anwendet, um Computerprogramme zur Verarbeitung natürlicher Sprache zu entwickeln.[2]

Die Funktionsweise von NLP basiert auf der Verarbeitung von linguistischen Daten. Zunächst wird die menschliche Sprache durch den Computer in eine Form umgewandelt, die der Computer verarbeiten kann. Dies wird normalerweise durch Tokenisierung (Aufteilung in einzelne Wörter oder Sätze), Lemmatisierung (Reduktion von Wörtern auf ihre Grundform) und Part-of-Speech-Tagging (Zuordnung von Wortarten) erreicht.

Dann werden verschiedene Techniken wie Syntaxanalyse, semantische Analyse und Named Entity Recognition (Erkennung von Entitäten wie Personen, Orte, Organisationen usw.) verwendet, um die Bedeutung der Sprache zu verstehen und sie in einen Kontext zu setzen.

Schließlich können NLP-Systeme verwendet werden, um menschliche Sprache zu generieren, indem sie aus einem Pool von Wörtern und Sätzen auswählen, um natürliche und kohärente Antworten zu erzeugen.

Insgesamt ermöglicht NLP es Computern, menschliche Sprache auf ähnliche Weise wie Menschen zu verstehen und zu verarbeiten, was die Automatisierung von Aufgaben wie Übersetzung, Zusammenfassung und automatischer Antwort auf Fragen ermöglicht.

Siehe auch

Literatur

  • James Allen: Natural Language Understanding. The Benjamin/ Cummings Publishing Company, Redwood City, CA 1995, ISBN 0-8053-0334-0.
  • Kai-Uwe Carstensen, Christian Ebert, Cornelia Ebert, Susanne Jekat, Ralf Klabunde, Hagen Langer (Hrsg.): Computerlinguistik und Sprachtechnologie. 3. Auflage. Spektrum Akademischer Verlag, Heidelberg 2010, ISBN 978-3-8274-2023-7.
  • Roland Hausser: Foundations of Computational Linguistics: Human-Computer Communication in Natural Language. 3. Auflage. Springer, 2014, ISBN 978-3-642-41430-5.
  • Nitin Indurkhya, Fred J. Damerau: Handbook of Natural Language Processing. 2. Auflage. Chapman and Hall/CRC, 2010, ISBN 978-1-4200-8592-1.
  • Daniel Jurafsky, James H. Martin: Speech and Language Processing - An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition. 2. Auflage. Prentice Hall, Upper Saddle River, New Jersey 2008, ISBN 978-0-13-187321-6.
  • Henning Lobin: Computerlinguistik und Texttechnologie. Fink, Paderborn/ München 2010, ISBN 978-3-8252-3282-5.
  • Christopher D. Manning, Hinrich Schütze: Foundations of Statistical Natural Language Processing. MIT Press, Cambridge/MA 1999, ISBN 0-262-13360-1.
  • Ruslan Mitkov (Hrsg.): The Oxford Handbook of Computational Linguistics. Oxford University Press, 2003, ISBN 0-19-823882-7.

Einzelnachweise

  1. I. Bátori, J. Krause, H. D. Lutz (Hrsg.): Linguistische Datenverarbeitung. Versuch einer Standortbestimmung im Umfeld von Informationslinguistik und Künstlicher Intelligenz. Niemeyer Verlag, Tübingen 1982.
  2. Natural Language Processing (NLP): What it is and why it matters. Abgerufen am 14. Februar 2023 (english).