Wörterbücher und automatische Morphologieanalyse
in der Computerlinguistik, WS 1999/2000
Pius ten Hacken
Beschreibung
Da die Erstellung von Wörterbücher für die Computerlinguistik
sehr aufwendig ist, ist in verschiedener Weise versucht worden, der Gesamtaufwand
durch Wiederverwendung bereits geleisteter Arbeit oder Erstellung von wiederverwendbaren
Komponenten zu verringern. Da Wörter, wie sie in Texten vorkommen,
auch mit den Wörterbucheinträgen verbunden werden müssen,
bildet die Morphologie eine wichtige Schnittstelle zwischen Wörterbüchern
und computerlinguistischen Systemen. Es werden hier einige der wichtigsten
Ansätzen vorgestellt, die die Probleme, die sich in den Bereichen
Wörterbuch und Morphologie stellen, in unterschiedlichen Weisen zu
lösen versuchen.
Wochenplan
18.10.1999 Einleitung: Wörterbücher in de Computerlinguistik;
Methoden und Qualitätssicherung in der Lexikographie
25.10.1999 Informationstypen in Wörterbüchern
und ihre Extraktion
1.11.1999 Lexikalische Datenbanken: Celex
8.11.1999 Zweiebenemorphologie
15.11.1999 keine Veranstaltung
22.11.1999
29.11.1999
6.12.1999 DATR:
ein deklaratives System für die Repräsentation von lexikalischen
Informationen
13.12.1999
20.12.1999
10.1.2000 Word
Manager
17.1.2000
24.1.2000
31.1.2000 Evaluation und Zusammenfassung
14.3.2000 Demo Word Manager: Petersgraben
51, Basel, Raum 206, Beginn 14.15 Uhr
Literaturangaben
Diese Artikel und Bücher eignen sich für eine Vertiefung der
Themen in der Vorlesung.
Lexikographie
Hausmann, Franz Josef (1985), 'Lexikographie', in Schwarze, Christoph &
Wunderlich, Dieter (eds.), Handbuch der Lexikologie, Königstein/Ts.:
Athenäum, p. 367-411.
Sinclair, John M. (ed.) (1987), Looking Up; An account of the COBUILD
Project in lexical computing and the development of the Collins COBUILD
English Language Dictionary, London & Glasgow: Collins ELT.
Maschinelesbare Wörterbücher
Boguraev, Branimir K. (1995), 'Machine-Readable Dictionaries and Computational
Linguistics Research', in Walker, Donald E.; Zampolli, Antonio & Calzolari,
Nicoletta (eds.), Automating the Lexicon: Research and Practice in a
Multilingual Environment, Oxford: Oxford University Press, p. 301-336.
Boguraev, Bran & Briscoe, Ted (eds.) (1989), Computational Lexicography
for Natural Language Processing, London: Longman.
Boguraev, Branimir K. (1991), 'Building a Lexicon: The Contribution
of Computers'. International Journal of Lexicography 4:227-260.
Wilks, Yorick A.; Slator, Brian M. & Guthrie, Louise M. (1996),
Electric
Words: Dictionaries, Computers, and Meanings, Cambridge (Mass.): MIT
Press.
Celex
van der Wouden, Ton (1988), 'CELEX: Building a Multifunctional, Polytheoretical
Lexical Database', in Magay, T. & Zigány, J. (eds.) (1990),
BudaLEX
í88 Proceedings, Papers from the 3rd International EURALEX Congress,
Budapest, 4-9 September 1988, Budapest: Akadémiai Kiadó,
p. 363-373.
Morphologie (Allgemein)
Matthews, Peter H. (1974), Morphology: An Introduction to the Theory
of Word Structure, Cambridge: Cambridge University Press (2nd ed. 1991).
Sproat, Richard W. (1992), Morphology and Computation, Cambridge
(Mass.): MIT Press.
Zweiebenemorphologie
Antworth, Evan L. (1990), PC-KIMMO:
A Two-level Processor for Morphological Analysis, Dallas (Texas): Summer
Institute of Linguistics.
Karttunen, Lauri (1991), 'Finite-State
Constraints', in Proceedings - International Conference on Current
Issues in Computational Linguistics, Penang: Universiti Sains Malaysia,
p. 23-40.
Barton Jr., G. Edward; Berwick, Robert C. & Ristad, Eric Sven (1987),
Computational
Complexity and Natural Language, Cambridge (Mass.): MIT Press.
Koskenniemi, Kimmo & Church, Kenneth W. (1988), 'Complexity, two-level
morphology and Finnish', in Coling 1988 Proceedings, p. 335-340.
DATR
Evans, Roger & Gazdar, Gerald (1996), 'DATR:
A Language for Lexical Knowledge Representation', Computational
Linguistics 22:167-216.
Word Manager
ten Hacken, Pius & Domenig, Marc (1996), 'Reusable
Dictionaries for NLP: The Word Manager Approach', Lexicology
2:232-255.
10-Feb-2000 Pius ten Hacken