1. Arbeitstreffen
Thema: Datenmodellierung für Internetwörterbücher (5. und 6. Mai 2011, Institut für Deutsche Sprache, Mannheim)
(Programm des öffentlichen Teils, 1. Arbeitsbericht)
Die Datenmodellierung für Wörterbücher sollte generell medienunabhängig erfolgen, sodass aus einer Wörterbuchsubstanz verschiedene Wörterbücher in unterschiedlichen Medien hergestellt werden können. Geeignete Formate hierfür sind etwa XML-DTDs oder XML-Schemata, aber auch eine netzartige Modellierung in Relationen und Knoten. Neben wörterbuchspezifischen Modellierungen gibt es Standards, wie etwa das "Lexical Markup Framework for natural language processing (NLP) and machine-readable dictionaries (MRD) and lexicons" (LMF, ISO-24613:2008) oder das Dokumentformat der "Text Encoding Initiative", deren Einsatz für die Datenmodellierung bei Internetwörterbüchern zu diskutieren ist.
Für elektronische Wörterbücher muss die Modellierung aber noch weiteren Anforderungen genügen: Hier bestimmen die erwünschten Zugriffsmöglichkeiten auf die Daten, wie diese modelliert werden müssen (vgl. Gloning / Welter 2001 und Müller-Spitzer 2005). Bei Internetwörterbüchern ist darüber hinaus bei der Modellierung zu berücksichtigen, dass eine flexible Präsentation der Suchergebnisse angestrebt werden soll, und zwar je nach Nutzergruppe oder Nutzungssituation (Storrer 2001). Internetwörterbücher können solche flexiblen Zugriffs- und Präsentationsmöglichkeiten dann realisieren, wenn bei der Datenmodellierung die Funktionalitäten des Computers gleich mitgedacht wurden (de Schryver 2003).
Beim Arbeitstreffen wird die Modellierung verschiedener Internetwörterbücher in Konzeption und Realisierung vorgestellt und mit anderen, von konkreten Wörterbuchprojekten unabhängigen Modellierungsvorschlägen kontrastiert. Dabei können Vor- und Nachteile des jeweiligen Vorgehens diskutiert werden, sodass deutlich wird, welche Formen der Datenmodellierung für Internetwörterbücher am besten geeignet sind, wenn flexible Zugriffs- und Präsentationsmöglichkeiten realisiert werden sollen. Zu erwarten ist auch eine Antwort auf die Frage, ob die Gewinnung der Daten aus unterschiedlichen Quellen (z. B. elektronische Textkorpora, Belegarchive) Einfluss auf die Art ihrer Modellierung hat.
Gäste
Dr. Melina Alexa (Dudenverlag Mannheim) zum Thema "Modellierung eines semantischen Netzes für lexikografische Anwendungen (am Beispiel der Duden-Ontologie)"
Dr. Dennis Spohr (Center fo Excellence Cognitive Interaction Technology – CITEC / Semantic Computing Group, Universität Bielefeld) zum Thema "Zur Datenmodellierung bzw. Architektur für 'pluri-monofunctional dictionaries'"
Literatur
Gloning, Thomas / Welter, Rüdiger (2001): Wortschatzarchitektur und elektronische Wörterbücher: Goethes Wortschatz und das Goethe-Wörterbuch. In: Lemberg, Ingrid / Schröder, Bernhard / Storrer, Angelika (Hg.): Chancen und Perspektiven computergestützter Lexikographie: Hypertext, Internet und SGML/XML für die Produktion und Publikation digitaler Wörterbücher. Max Niemeyer: Tübingen, S. 117−132.
Klosa, Annette / Müller-Spitzer, Carolin (Hg.) (2011): Datenmodellierung für Internetwörterbücher. 1. Arbeitsbericht des wissenschaftlichen Netzwerks „Internetlexikografie“. Mannheim: Institut für Deutsche Sprache. (OPAL - Online publizierte Arbeiten zur Linguistik 2/2011)
Müller-Spitzer, Carolin (2005): Die Modellierung lexikografischer Daten und ihre Rolle im lexikografischen Prozess. In: Haß, Ulrike (Hg.): Grundfragen der elektronischen Lexikographie. elexiko − das Online-Informationssystem zum deutschen Wortschatz. de Gruyter: Berlin / New York, S. 21−54. (Schriften des Instituts für Deutsche Sprache 12)
de Schryver, Gilles-Maurice (2003): Lexicographers' Dreams in the Electronic-Dictionary Age. In: International Journal of Lexicography 16 / 2, S. 143−199.
Storrer, Angelika (2001): Digitale Wörterbücher als Hypertexte: Zur Nutzung des Hypertextkonzepts in der Lexikographie. In: Lemberg, Ingrid / Schröder, Bernhard / Storrer, Angelika (Hg.): Chancen und Perspektiven computergestützter Lexikographie: Hypertext, Internet und SGML/XML für die Produktion und Publikation digitaler Wörterbücher. Max Niemeyer: Tübingen, S. 53−69.