Wörterbücher und automatische Morphologieanalyse

                        in der Computerlinguistik, WS 1999/2000

                                                                Pius ten Hacken

Beschreibung

Da die Erstellung von Wörterbücher für die Computerlinguistik sehr aufwendig ist, ist in verschiedener Weise versucht worden, der Gesamtaufwand durch Wiederverwendung bereits geleisteter Arbeit oder Erstellung von wiederverwendbaren Komponenten zu verringern. Da Wörter, wie sie in Texten vorkommen, auch mit den Wörterbucheinträgen verbunden werden müssen, bildet die Morphologie eine wichtige Schnittstelle zwischen Wörterbüchern und computerlinguistischen Systemen. Es werden hier einige der wichtigsten Ansätzen vorgestellt, die die Probleme, die sich in den Bereichen Wörterbuch und Morphologie stellen, in unterschiedlichen Weisen zu lösen versuchen.
 

Wochenplan

18.10.1999    Einleitung: Wörterbücher in de Computerlinguistik; Methoden und Qualitätssicherung in der Lexikographie
25.10.1999    Informationstypen in Wörterbüchern und ihre Extraktion
1.11.1999      Lexikalische Datenbanken: Celex
8.11.1999      Zweiebenemorphologie
15.11.1999    keine Veranstaltung
22.11.1999
29.11.1999
6.12.1999      DATR: ein deklaratives System für die Repräsentation von lexikalischen Informationen
13.12.1999
20.12.1999
10.1.2000      Word Manager
17.1.2000
24.1.2000
31.1.2000      Evaluation und Zusammenfassung

14.3.2000      Demo Word Manager: Petersgraben 51, Basel, Raum 206, Beginn 14.15 Uhr

Literaturangaben

Diese Artikel und Bücher eignen sich für eine Vertiefung der Themen in der Vorlesung.

Lexikographie

Hausmann, Franz Josef (1985), 'Lexikographie', in Schwarze, Christoph & Wunderlich, Dieter (eds.), Handbuch der Lexikologie, Königstein/Ts.: Athenäum, p. 367-411.

Sinclair, John M. (ed.) (1987), Looking Up; An account of the COBUILD Project in lexical computing and the development of the Collins COBUILD English Language Dictionary, London & Glasgow: Collins ELT.

Maschinelesbare Wörterbücher

Boguraev, Branimir K. (1995), 'Machine-Readable Dictionaries and Computational Linguistics Research', in Walker, Donald E.; Zampolli, Antonio & Calzolari, Nicoletta (eds.), Automating the Lexicon: Research and Practice in a Multilingual Environment, Oxford: Oxford University Press, p. 301-336.

Boguraev, Bran & Briscoe, Ted (eds.) (1989), Computational Lexicography for Natural Language Processing, London: Longman.

Boguraev, Branimir K. (1991), 'Building a Lexicon: The Contribution of Computers'. International Journal of Lexicography 4:227-260.

Wilks, Yorick A.; Slator, Brian M. & Guthrie, Louise M. (1996), Electric Words: Dictionaries, Computers, and Meanings, Cambridge (Mass.): MIT Press.

Celex

van der Wouden, Ton (1988), 'CELEX: Building a Multifunctional, Polytheoretical Lexical Database', in Magay, T. & Zigány, J. (eds.) (1990), BudaLEX í88 Proceedings, Papers from the 3rd International EURALEX Congress, Budapest, 4-9 September 1988, Budapest: Akadémiai Kiadó, p. 363-373.

Morphologie (Allgemein)

Matthews, Peter H. (1974), Morphology: An Introduction to the Theory of Word Structure, Cambridge: Cambridge University Press (2nd ed. 1991).

Sproat, Richard W. (1992), Morphology and Computation, Cambridge (Mass.): MIT Press.

Zweiebenemorphologie

Antworth, Evan L. (1990), PC-KIMMO: A Two-level Processor for Morphological Analysis, Dallas (Texas): Summer Institute of Linguistics.

Karttunen, Lauri (1991), 'Finite-State Constraints', in Proceedings - International Conference on Current Issues in Computational Linguistics, Penang: Universiti Sains Malaysia, p. 23-40.

Barton Jr., G. Edward; Berwick, Robert C. & Ristad, Eric Sven (1987), Computational Complexity and Natural Language, Cambridge (Mass.): MIT Press.

Koskenniemi, Kimmo & Church, Kenneth W. (1988), 'Complexity, two-level morphology and Finnish', in Coling 1988 Proceedings, p. 335-340.

DATR

Evans, Roger & Gazdar, Gerald (1996), 'DATR: A Language for Lexical Knowledge Representation', Computational Linguistics 22:167-216.

Word Manager

ten Hacken, Pius & Domenig, Marc (1996), 'Reusable Dictionaries for NLP: The Word Manager Approach', Lexicology 2:232-255.


10-Feb-2000  Pius ten Hacken