
Konkordanz: DDC, RVK & SWD
Dokumentinformationen
Autor | Fabian Heel |
instructor | Prof. Heidrun Wiesenmüller |
Schule | Hochschule der Medien Stuttgart |
Fachrichtung | Bibliotheks- und Informationsmanagement |
Dokumenttyp | Bachelorarbeit |
city | Stuttgart |
Sprache | German |
Format | |
Größe | 719.82 KB |
Zusammenfassung
I.Die Herausforderung heterogener Sacherschließung in deutschen Bibliotheken
Deutsche wissenschaftliche Bibliotheken verwenden eine Vielzahl unterschiedlicher Sacherschließungssysteme (z.B. DDC, SWD, RVK), was zu Problemen bei der Recherche führt. Benutzer benötigen Kenntnisse verschiedener Systeme, um themenbezogene Ergebnisse in heterogenen Datenbeständen zu erzielen. Dies erhöht den Arbeitsaufwand für Bibliothekare und frustriert die Nutzer. Die Lösung besteht in einem integrierten Retrieval, das durch Konkordanzen verschiedene Indexierungssysteme verbindet und Benutzern einen einheitlichen Zugang mit einem vertrauten Vokabular ermöglicht.
1. Die aktuelle Situation der Sacherschließung in Deutschland
Die Sacherschließung in deutschen Bibliotheken ist durch eine große Vielfalt an Systemen geprägt. Neben der Schlagwortnormdatei (SWD), der Dewey-Dezimalklassifikation (DDC), und der Gemeinsamen Körperschaftsdatei (GKD) existieren zahlreiche Universal- und Fachklassifikationen sowie Fachthesauri. Diese Heterogenität erschwert Benutzern die themenspezifische Recherche in Bibliothekskatalogen und Datenbanken. Um ein gewünschtes Rechercheergebnis datenbankübergreifend zu erhalten, müssen Nutzer den Umgang mit verschiedenen Erschließungsinstrumenten erlernen und unterschiedliche Suchanfragen verwenden. Die wissenschaftlichen Bibliotheken entscheiden sich meist für ein einzelnes Sacherschließungsinstrument. Eine zusätzliche verbale Inhaltserschließung klassifikatorisch erschlossener Medien findet nur selten statt. Dies führt dazu, dass Benutzer ohne ausreichende Kenntnisse des jeweiligen Klassifikationssystems keine Treffer erhalten. Die Vielzahl an verschiedenen Systemen und die fehlende Standardisierung stellen eine erhebliche Herausforderung für die effiziente und benutzerfreundliche Recherche dar. Eine Einigung auf ein einziges System scheint derzeit unerreichbar, sodass die Heterogenität als Ausgangspunkt akzeptiert werden muss.
2. Die Folgen der heterogenen Sacherschließung für Bibliotheksbenutzer und Bibliothekare
Die Inkonsistenz der Sacherschließung führt zu erheblichen Problemen für die Benutzer wissenschaftlicher Bibliotheken. Um erfolgreich zu recherchieren, müssen sie sich mit unterschiedlichen Systemen und deren spezifischen Merkmalen auseinandersetzen. Dies erhöht den Aufwand und führt häufig zu Frustration und Resignation, insbesondere bei umfassenden themenspezifischen Suchanfragen. Auch Recherchen in ausländischen Bibliotheksbeständen werden durch die Heterogenität erschwert. Für die Bibliothekare bedeutet die Vielzahl an Systemen einen erhöhten Arbeitsaufwand bei der Erschließung und Pflege der Bestände. Die fehlende Interoperabilität zwischen den Systemen verhindert eine effiziente Zusammenarbeit und den Austausch von Metadaten. Eine Lösung dieser Problematik ist daher von großer Bedeutung, um sowohl den Benutzern als auch den Bibliothekaren eine erleichterte und effizientere Arbeit zu ermöglichen.
3. Die Notwendigkeit eines integrierten Retrievals
Als Lösung für die Probleme der heterogenen Sacherschließung wird die Entwicklung eines integrierten Retrievals vorgeschlagen. Dieses Retrieval soll verschiedene Sacherschließungssysteme miteinander verknüpfen, um Benutzern einen einheitlichen Zugang zu heterogenen Datenbeständen zu ermöglichen. Durch die Verwendung von Konkordanzen können Suchanfragen automatisch in verschiedene Indexierungssprachen übersetzt werden. Der Vorteil liegt in der Möglichkeit, mit einem vertrauten Vokabular in verschiedenen Datenbanken zu recherchieren, ohne die spezifischen Eigenheiten der verschiedenen Erschließungssysteme kennen zu müssen. Ein integriertes Retrieval reduziert nicht nur den Aufwand für die Benutzer, sondern auch für die Bibliothekare. Es ermöglicht die retrospektive Erschließung von Altbeständen und vereinfacht die Nachnutzung von sachlichen Erschließungsdaten in Fremddaten. Dadurch kann der Aufwand für die Erschließung von fremdsprachiger Literatur gesenkt oder sogar automatisert werden. Die Entwicklung eines solchen Systems ist von entscheidender Bedeutung für die Zukunft der wissenschaftlichen Bibliotheken in Deutschland.
II.Ansätze zur Lösung Integriertes Retrieval durch Konkordanzerstellung
Ein integriertes Retrieval wird durch die Erstellung von Konkordanzen zwischen verschiedenen Sacherschließungssystemen (DDC, SWD, RVK) erreicht. Dies erlaubt Nutzern die Recherche mit einem bekannten Vokabular, unabhängig von den spezifischen Eigenheiten der einzelnen Systeme. Projekte wie Colibri, MACS und CARMEN untersuchen die automatische Konkordanzerstellung und die Behandlung von Heterogenität in Bibliotheksdaten. Metathesauri werden als Methode zur Zusammenführung verschiedener Thesauri diskutiert. Die Arbeit untersucht die Möglichkeiten und Herausforderungen bei der Erstellung eines solchen Recherchetools.
1. Konkordanzerstellung als Lösungsansatz für integriertes Retrieval
Die Kernidee zur Lösung der Heterogenität in der deutschen Bibliothekslandschaft liegt in der Erstellung eines integrierten Retrievals. Dies wird durch die systematische Verknüpfung unterschiedlicher Sacherschließungssysteme mithilfe von Konkordanzen erreicht. Der Ansatz zielt darauf ab, den Benutzern einen einheitlichen Zugang zu heterogenen Datenbeständen zu gewährleisten und gleichzeitig den Arbeitsaufwand für die Bibliothekare zu reduzieren. Durch die Konkordanzen sollen Suchanfragen automatisch in andere Indexierungssprachen übersetzt werden, sodass die Recherche mit einem dem Benutzer vertrauten Vokabular möglich ist, ohne dass dieser die spezifischen Besonderheiten der verschiedenen Systeme kennen muss. Dies ermöglicht eine effizientere und benutzerfreundlichere Recherche in den verschiedenen Datenbeständen.
2. Automatisierte Verfahren und Projekte zur Konkordanzerstellung
Die Erstellung von Konkordanzen kann mit Hilfe von automatisierten Verfahren unterstützt werden. Als Beispiel wird das Projekt Colibri genannt, das sich mit der automatischen Klassifikation von Titeln beschäftigt und die automatische Vergabe von DDC-Notationen anstrebt. Dabei werden statistische Verfahren und eine „Klassen-Deskriptor-Ähnlichkeitsmatrix“ eingesetzt, um passende Schlagwörter zu finden und zu verknüpfen. Weitere Projekte wie MACS und CARMEN befassen sich ebenfalls mit der Konkordanzerstellung zwischen verschiedenen Klassifikationen und Thesauri. Diese Projekte untersuchen unterschiedliche Methoden und Methodologien zur Erstellung und Darstellung von Konkordanzen. Im Kontext dieser Projekte wird auch die Frage der Heterogenitätsbehandlung und der automatischen Übersetzung von Suchanfragen in verschiedene Indexierungssprachen angesprochen. Die Ergebnisse dieser Projekte sollen als Grundlage für die Entwicklung eines zukünftigen Recherchetools dienen.
3. Metathesauri und Crosskonkordanzen im Kontext des integrierten Retrievals
Neben der Konkordanzerstellung zwischen einzelnen Systemen werden auch Metathesauri als Methode zur Zusammenführung verschiedener Thesauri erwähnt. Im Gegensatz zu Crosskonkordanzen, bei denen die Anzahl der sich aufeinander abbildenden Begriffe unerheblich ist, fokussieren Metathesauri auf die Zusammenführung verschiedener Begriffssysteme für das Retrieval. Die Diskussion um Metathesauri und Crosskonkordanzen unterstreicht die Vielfalt an möglichen Ansätzen zur Lösung des Problems heterogener Sacherschließung. Die Wahl des geeigneten Verfahrens hängt von den spezifischen Anforderungen und den gegebenen Rahmenbedingungen ab. Die Kombination verschiedener Methoden könnte eine optimale Lösung bieten, um ein umfassendes und effizientes integriertes Retrieval zu erstellen. Die Arbeit analysiert die Vor- und Nachteile der verschiedenen Ansätze und zeigt die Herausforderungen bei der Implementierung auf.
III.Vergleich der Systeme DDC SWD und RVK
Der Vergleich der Dewey-Dezimalklassifikation (DDC), der Schlagwortnormdatei (SWD) und der Regensburger Verbundklassifikation (RVK) zeigt unterschiedliche Stärken und Schwächen auf. Die DDC bietet eine detaillierte, hierarchische Struktur, ist aber international ausgerichtet und nicht immer optimal für den deutschen Kontext. Die SWD ist ein wichtiges Schlagwortverzeichnis, leidet aber unter mangelnder Detaillierung in der hierarchischen Struktur. Die RVK ist weit verbreitet im deutschsprachigen Raum und versucht, verbale und klassifikatorische Sacherschließung zu integrieren. Die Erstellung von Konkordanzen zwischen diesen Systemen stößt auf Herausforderungen, insbesondere aufgrund unterschiedlicher Strukturen und Detaillierungsgrade. Das Projekt 'DDC deutsch' wird erwähnt, sowie die Deutsche Nationalbibliothek (DNB) als wichtige Institution in diesem Zusammenhang.
1. Dewey Dezimalklassifikation DDC Stärken und Schwächen
Die Dewey-Dezimalklassifikation (DDC) zeichnet sich durch ihre hierarchische Struktur mit zehn Hauptklassen, hundert Klassen der zweiten Ebene und tausend Klassen der dritten Ebene aus. Diese detaillierte Gliederung ermöglicht eine präzise Klassifizierung. Die DDC ist international weit verbreitet, was den internationalen Datenaustausch vereinfacht und Metasuchen im Internet ermöglicht. Die deutsche Ausgabe (DDC 22, 2003) wurde im Rahmen des Projekts „DDC deutsch“ in Kooperation mit der DNB und der Fachhochschule Köln überarbeitet und an deutsche Rahmenbedingungen angepasst. Trotz ihrer Vorteile gibt es Kritikpunkte: Das zentralisierte Management, die Lizenzkosten für den vollständigen Zugriff auf die Klassifikation, Defizite im Bereich des deutschen und europäischen Rechts, das Fehlen einer eigenen Klasse für „Archäologie“ und die unangemessene Struktur im Bereich „Sprache und Literatur“ werden als Nachteile gesehen. Die DNB setzt die DDC seit 2006 teilweise als Sacherschließungsinstrument ein, was jedoch auf vehemente Kritik gestoßen ist. Zusätzliche Tools wie MelvilClass und MelvilSearch ermöglichen verbesserte Recherche-Möglichkeiten mit der DDC.
2. Schlagwortnormdatei SWD Spezifität und hierarchische Herausforderungen
Die Schlagwortnormdatei (SWD) dient als deutsche Normdatei für Schlagwörter. Ein Problem lag früher im Fehlen von Unterbegriffen in den elektronischen Ausgaben; dies wurde jedoch durch Verlinkungen gelöst. Trotzdem ist die direkte Anzeige von Unterbegriffen am Datensatz wünschenswert, um das semantische Netz und die hierarchische Gliederung zu vereinfachen. Ein weiterer Kritikpunkt betrifft das Fehlen von Oberbegriffen bei geomorphologischen Einheiten. Obwohl Ländercodes für geografische Suchen verwendet werden können, wären zusätzliche Systematiknummern oder sachliche Oberbegriffe hilfreich. Der Vergleich mit anderen Normdateien wie LCSH und Rameau zeigt weitere Unterschiede in der Struktur und der Detailliertheit der Schlagwortvergabe. Die SWD wird als ein wichtiges Schlagwortverzeichnis beschrieben, leidet jedoch unter manchmal unzulänglicher Spezifizierung der hierarchischen Relationen zwischen den Sachschlagwörtern, was die Konkordanzerstellung erschwert.
3. Regensburger Verbundklassifikation RVK Integration verbaler und klassifikatorischer Erschließung
Die Regensburger Verbundklassifikation (RVK) ist die am weitesten verbreitete Verbundsystematik im deutschsprachigen Raum. Sie zeichnet sich durch ihre Etablierung an wissenschaftlichen Bibliotheken aus und wird laufend gepflegt. Über „RVK-Online“ werden inhaltliche Online-Recherchen ermöglicht. Im Gegensatz zur DDC versucht die RVK, verbale und klassifikatorische Erschließung zu integrieren, indem die Systemstellenbenennungen in eine register- und indexfähige Form gebracht und mit der SWD abgeglichen wurden. Dadurch ist eine Recherche mit denselben Schlagwörtern sowohl verbal als auch systematisch möglich. Die RVK wird als im Internet frei verfügbare Klassifikation ohne zusätzliche Lizenzen hervorgehoben. Trotz dieser Vorteile besteht im Vergleich mit der DDC ein Mangel an spezifischen Notationsstellen für bestimmte Sachverhalte, z.B. für verschiedene Arten von Bibliographien oder die genaue Untergliederung von Informationssystemen. Diese Mängel wirken sich auf die Möglichkeit der Erstellung exakter Konkordanzen aus.
IV.Konkordanzerstellung Methodik und Ergebnisse
Die Konkordanzerstellung basiert auf der Analyse von Parallelkorpora, also gleichzeitig in verschiedenen Systemen erschlossenen Dokumenten. Dabei werden statistische Verfahren und automatisierte Methoden eingesetzt. Die Arbeit präsentiert eine exemplarische SWD-DDC-Konkordanz und eine SWD-RVK-Konkordanz, die die Herausforderungen und Möglichkeiten der Heterogenitätsbehandlung aufzeigen. Es werden verschiedene Determinierungsgrade für die Übereinstimmung von Begriffen eingeführt (1-4). Die Ergebnisse zeigen, dass hohe Übereinstimmungsgrade erzielt werden können, aber auch Probleme durch unterschiedliche Strukturen und Kontexte auftreten.
1. Methodik der Konkordanzerstellung
Die Konkordanzerstellung basiert auf der Analyse von 'Parallelkorpora', also Dokumenten, die in mehreren Systemen (z.B. DDC, SWD, RVK) indexiert sind. Die Häufigkeit des gemeinsamen Auftretens von Begriffen in diesen Korpora dient als Grundlage für die automatische Konkordanzerstellung. Statistische Verfahren werden eingesetzt, um die Beziehungen zwischen den verschiedenen Indexierungssprachen zu ermitteln. Zwei unterschiedlich erschlossene Dokumente werden in Beziehung zueinander gesetzt. Die Zusammenführung von Bibliotheksbeständen mit Fachdatenbanken wird als günstige Ausgangsgrundlage für die Konkordanzerstellung betrachtet, da Informationszentren häufig selbstständige Literatur aufnehmen, die dann mindestens doppelt indexiert vorliegt. Bei der manuellen Erstellung der Konkordanzen wurden sowohl 1:1- als auch 1:n-Relationen berücksichtigt, um den Bedeutungsumfang der Ausgangsterme adäquat abzubilden. Ein für das Projekt entwickeltes Tool ermöglichte die Darstellung der SWD in ihrer hierarchischen Struktur und erleichterte die Identifizierung von Relationen zwischen den verschiedenen Systemen. Die Vergabe von Determinierungsgraden (1-4) dient der Gewichtung der Verbindungen und zeigt die Stärke der Übereinstimmung zwischen den Begriffen an.
2. Ergebnisse der Konkordanzerstellung SWD DDC und SWD RVK
Die Arbeit präsentiert exemplarisch die Ergebnisse der Konkordanzerstellung zwischen der SWD und der DDC sowie zwischen der SWD und der RVK. Im Bereich Bibliotheks- und Informationswissenschaften wurden die entsprechenden Notationsstellen in den drei Systemen verglichen. Bei der SWD-DDC-Konkordanz wurden Probleme bei der Relationserstellung durch unklare Kontexte innerhalb der SWD und ungenügend spezifizierte hierarchische Relationen festgestellt. Es zeigt sich, dass die DDC oftmals eine tiefere Untergliederung besitzt als die SWD und die RVK, was zu Mehrfachverknüpfungen und einem gewissen Qualitätsverlust führen kann. Im Gegensatz dazu konnten im Bereich verschiedener Bibliotheksarten sehr exakte 1:1-Relationen gefunden werden. Die SWD-RVK-Konkordanz zeigt einen größeren Anteil hoher Entsprechungen aufgrund der gleichen Sprachherkunft und des gleichen Sprachgebrauchs. Jedoch besteht auch hier das Problem der geringeren Spezifität auf Seiten der RVK, was zu einem höheren Anteil an nicht realisierbaren Relationen führt. Die Unterschiede in der Detailliertheit und der Strukturierung der verschiedenen Systeme stellen eine erhebliche Herausforderung bei der Konkordanzerstellung dar.
3. Bewertung der Ergebnisse und Ausblick
Die ausgewerteten Konkordanzen zeigen sowohl gute Übereinstimmungen als auch erhebliche Probleme bei der Zuordnung von Begriffen. Der hohe Anteil von Relationen mit hohen Übereinstimmungsgraden (z.B. ca. 88,1% mit Determinierungsgrad 2 oder 3 bei der DDC-RVK-Konkordanz) deutet auf die Möglichkeit einer erfolgreichen Konkordanzerstellung hin. Allerdings zeigen sich auch deutliche Schwächen in der Spezifität und der Klare der hierarchischen Strukturen insbesondere in der SWD, was die Erstellung von Konkordanzen erschwert. Die Bildung von 1:n-Relationen wird als Methode zur Lösung von Problemen bei der Zuordnung von Begriffen angeführt. Die Ergebnisse geben einen ersten Überblick über Möglichkeiten und Problemfelder für die Erstellung eines zukünftigen Recherchetools. Die Unterschiede zwischen den Systemen lassen sich teilweise auf ihre unterschiedliche Herkunft und kulturelle Ursprünge zurückführen. Für ein zukünftiges Recherchetool werden weitere Untersuchungen und Verbesserungen der Konkordanzdaten erforderlich.