Arbeitstreffen
Geplant sind die folgenden Arbeitstreffen, die je nach Themenumfang zwischen anderthalb und zweieinhalb Tagen dauern sollen:
1. Arbeitstreffen „Datenmodellierung für Internetwörterbücher“
Die Datenmodellierung für Wörterbücher sollte generell medienunabhängig erfolgen, sodass aus einer Wörterbuchsubstanz verschiedene Wörterbücher in unterschiedlichen Medien hergestellt werden können. Geeignete Formate hierfür sind etwa XML-DTDs oder XML- Schemata, aber auch eine netzartige Modellierung in Relationen und Knoten. Neben wörterbuchspezifischen Modellierungen gibt es Standards, wie etwa das „Lexical Markup Framework for natural language processing (NLP) and machine-readable dictionaries (MRD) lexicons“ (LMF, ISO-24613:2008) oder das Dokumentformat der „Text Encoding Initiative“, deren Einsatz für die Datenmodellierung bei Internetwörterbüchern zu diskutieren ist.
Für elektronische Wörterbücher muss die Modellierung aber noch weiteren Anforderungen genügen: Hier bestimmen die erwünschten Zugriffsmöglichkeiten auf die Daten, wie diese modelliert werden müssen (vgl. Gloning / Welter 2001 und Müller-Spitzer 2005). Bei Internetwörterbüchern ist darüber hinaus bei der Modellierung zu berücksichtigen, dass eine flexible Präsentation der Suchergebnisse angestrebt werden soll, und zwar je nach Nutzergruppe oder Nutzungssituation (Storrer 2001). Internetwörterbücher können solche flexiblen Zugriffs- und Präsentationsmöglichkeiten dann realisieren, wenn bei der Datenmodellierung die Funktionalitäten des Computers gleich mitgedacht wurden (de Schryver 2003).
Beim Arbeitstreffen wird die Modellierung verschiedener Internetwörterbücher in Konzeption und Realisierung vorgestellt und mit anderen, von konkreten Wörterbuchprojekten unabhängigen Modellierungsvorschlägen kontrastiert. Dabei können Vor- und Nachteile des jeweiligen Vorgehens diskutiert werden, sodass deutlich wird, welche Formen der Datenmodellierung für Internetwörterbücher am besten geeignet sind, wenn flexible Zugriffs- und Präsentationsmöglichkeiten realisiert werden sollen. Zu erwarten ist auch eine Antwort auf die Frage, ob die Gewinnung der Daten aus unterschiedlichen Quellen (z. B. elektronische Textkorpora, Belegarchive) Einfluss auf die Art ihrer Modellierung hat.
2. Arbeitstreffen „Vernetzungsstrategien und Zugriffsstrukturen“
Die Vernetzung lexikografischer Daten auf der Makrostrukturebene kann in Internetwörterbüchern über Verlinkungen zwischen Wortartikeln, zwischen Lesarten verschiedener Wortartikel oder Angaben innerhalb von Wortartikeln geschehen (Müller- Spitzer 2007). Andere Webseiten können ebenfalls mit den lexikografischen Daten verlinkt werden, sodass von „Hypermedia-Wörterbüchern“ (Storrer 1998) bzw. „Wortschatz- informationssystemen“ (Müller-Spitzer 2003) gesprochen werden kann. Schließlich sind in so genannten Portalen mehrere Internetwörterbücher miteinander verbunden, wodurch das parallele Nachschlagen in mehreren Wörterbüchern gleichzeitig möglich wird.