ILIAS Lernplattform
24187 – Sprachverarbeitung in der Softwaretechnik
WS 21/22
KIT-Fakultät für Informatik
Organisationseinheiten
Magazin
Hilfe
Sprache
Deutsch
English
Anmelden
0
0
Mehr zeigen
Tools
Magazin
Mehr
Hilfe
Magazin - Einstiegsseite
Baumansicht
...
Schließen
Magazin
Organisationseinheiten
KIT-Fakultät für Informatik
WS 21/22
24187 – Sprachverarbeitung in der Softwaretechnik
Aktionen
Mehrere Objekte herunterladen
24187 – Sprachverarbeitung in der Softwaretechnik
Diese Vorlesung bietet die Grundlagen für die maschinelle Verarbeitung natürlichsprachlicher Texte.
Allgemeine Informationen
Wichtige Informationen
Sprachverarbeitung wird immer wichtiger. In interaktiven Systemen ist oftmals eine sprachliche Eingabe wünschenswert, z.B. für sprachliche Kommandos, für Hilfesysteme oder Anfragen im Internet. Außerdem ist die Analyse und Weiterverarbeitung von Software-Anforderungen ein neues Forschungsgebiet. Die Computerlinguistik ist somit nicht nur für Softwareanwendungen von großer Bedeutung, sondern auch für die Softwaretechnik selbst.
Ziel dieser Veranstaltung für Diplom- und Masterstudenten der Informatik und Informationswirtschaft ist es, das Grundwissen der Sprachverarbeitung und Anwendungsmöglichkeiten bei der Entwicklung von Software-Systemen zu vermitteln.
Die Themen umfassen die Verarbeitung von Texten mithilfe von Parsern, die Mehrdeutigkeit der natürlichen Sprache, die Erfassung von Semantik mithilfe von thematischen Rollen, die automatische Übersetzung von Texten in Softwaremodelle sowie den Aufbau und die Verwendung von Ontologien bei der Textanalyse. Zudem wird in der Vorlesung auf aktuelle Forschungsarbeiten eingegangen.
Lernziele:
Studierende kennen Grundbegriffe der Linguistik, wie Syntax, Semantik und Pragmatik und können diese erläutern sowie vergleichen. Sie kennen lexikalische Relationen (z.B.: Polysemie, Homonymie, Troponymie u. Ä) und können Beispiele entsprechend zuordnen. Weiterhin können Zusammenhänge zwischen den Relationen identifiziert und verglichen werden.
Studierende sind mit grundlegenden Konzepten der Computerlinguistik vertraut. Grundlegende Techniken, wie Wortartetikettierung, Lemmatisierung, Bestimmung von Wortähnlichkeiten oder Disambiguierungen können erläutert werden. Zugehörige Verfahren (lexikalisch, regelbasiert oder probabilistisch) können beschrieben und die jeweilige Stärken und Schwächen beurteilt werden. Unterschiedliche Parser-Verfahren können benannt, erläutert und konzeptionell reproduziert werden.
Studierende können Struktur, Inhalt und Nutzen unterschiedlicher Wissensdatenbanken beschreiben und vergleichen. Neben den übergeordneten Konzepten der Ontologie, Wortnetzen und anderen Wissensrepräsentationen sind sie auch mit konkreten Vertretern, wie researchCyc, WordNet, FrameNet und ähnlichen, vertraut und können diese nutzen. Verfahren zum manuellen und automatischen Aufbau von Ontologien sowie zur automatischen Relationsextraktion können von den Studierenden angewendet werden.
Die Studierenden verstehen den Zusammenhang zwischen Funktionsweise grundlegender Techniken der Computerlinguistik und ihrer Anwendbarkeit in der Softwaretechnik. Darüber hinaus können sie Werkzeugketten in Einzelbestandteile gliedern und bewerten. Insbesondere sind die Studierenden in der Lage unterschiedliche Anwendungen zu analysieren und zu bewerten. Hierzu zählen Anwendungen zur Modellierung mithilfe der Linguistik, Verbesserung von Spezifikationstexten und Qualitätsbeurteilung von Quelltextkommentaren.
Darüber hinaus können Studierende das Konzept aktiver Ontologien und deren Anwendung und Nutzung im Umfeld der Sprachverarbeitung erläutern.
Studierende können Anwendungsszenarien in der Softwaretechnik für Textanalysesysteme identifizieren und eigene Lösungen entwerfen. Hierfür sind den Studierenden unterschiedliche Werkzeuge zur Sprachverarbeitung, wie GATE, Protegé und NLTK, bekannt. Sie sind grundlegend mit ihrer Funktionsweise vertraut und können sie praktisch anwenden. Insbesondere können Studierende eigene Anwendungen mithilfe der vorgestellten Werkzeuge entwerfen und implementieren. Dabei können neue Lösungsansätze anhand der bekannten Verfahren konstruiert werden.
Arbeitsaufwand:
3 LP entspricht ca. 90 Arbeitsstunden, davon
ca. 30 Std. Vorlesungsbesuch
ca. 45 Std. Vor- und Nachbearbeitung
ca. 15 Std. Prüfungsvorbereitung
Veranstaltungsdaten
Abschluß
Master
Start
19. Okt 2021
Ende
8. Feb 2022
Veranstaltungsart
Vorlesung
Modulart
Wahlfach
Ort
R -118 (Geb. 50.34)
Termin
14-00 - 15:30
Zyklus
wöchtl.
Zusammenfassung
Diese Vorlesung bietet die Grundlagen für die maschinelle Verarbeitung natürlichsprachlicher Texte.
Allgemein
Sprache
Deutsch
Copyright
This work has all rights reserved by the owner.
Verfügbarkeit
Zugriff
Unbegrenzt – wenn online geschaltet
Aufnahmeverfahren
Sie können diesem Kurs direkt beitreten.
Zeitraum für Beitritte
Unbegrenzt
Veranstaltungszeitraum
19. Okt 2021 - 8. Feb 2022
Für Kursadministratoren freigegebene Daten
Daten des Persönlichen Profils
Anmeldename
Vorname
Nachname
E-Mail
Matrikelnummer
Zusätzliche Informationen
Objekt-ID
2185663