Analyse von maschinell generierten Korrelationen zwischen der Regensburger Verbundklassifikation (RVK) und der Schlagwortnormdatei (SWD)

RVK-SWD Korrelation: Analyse

Dokumentinformationen

Autor

Judith Probstmeyer

instructor Prof. Heidrun Wiesenmüller M.A.
Schule

Hochschule der Medien

Fachrichtung Wissensmanagement
Dokumenttyp Bachelorarbeit
Sprache German
Format | PDF
Größe 862.79 KB

Zusammenfassung

I.Heterogenität in der Erschließung von Bibliotheksdaten

Die Arbeit untersucht die Heterogenität in der inhaltlichen Erschließung von Bibliotheksdaten. Besonders die Unterschiede zwischen der Regensburger Verbundklassifikation (RVK) und der Standardisierten Schlagwortdatei (SWD) stehen im Fokus. Die verschiedenen Klassifikationssysteme (z.B. DDC, LCC) und ihre unterschiedlichen Notationen erschweren die Recherche. Der Einsatz von Thesauri und die Entwicklung von Crosskonkordanzen (Crosswalks) werden als Lösungsansätze diskutiert, um die Retrievalfähigkeit zu verbessern und die Homogenität zu steigern. Die automatische Klassifizierung wird als mögliches Werkzeug zur Verbesserung der Effizienz der Sacherschließung betrachtet, aber auch ihre Grenzen aufgezeigt.

1. Einleitung Heterogene Erschließungstechniken in Bibliotheksdatenbanken

Der einleitende Abschnitt beschreibt das zentrale Problem der Heterogenität in der Erschließung von Bibliotheksdaten. Inhaltlich erschlossene Dokumente ermöglichen im Vergleich zu rein formal erschlossenen Dokumenten eine deutlich effizientere Recherche. Trotz Fortschritten im Bereich der Sacherschließung besteht weiterhin Verbesserungsbedarf, insbesondere aufgrund der uneinheitlichen Erschließungstechniken. Es mangelt an Homogenität auf nationaler Ebene, in einzelnen Fachgebieten und bei den allgemein üblichen Methoden. Die parallele Existenz vieler unterschiedlicher Klassifikationen und Thesauri, die nicht aufeinander abgestimmt sind, führt zu Problemen. Nutzer benötigen oft Kenntnisse des jeweiligen Vokabulars und der Systematik, um relevante Informationen zu finden. Andernfalls droht der Verlust eines großen Teils relevanter Informationen. Dieses Problem der Inkonsistenz und fehlenden Standardisierung in der Erschließung von Daten bildet die Grundlage der weiteren Untersuchungen.

2. Die Regensburger Verbundklassifikation RVK Struktur und Aufbau

Die RVK wird als komplexes System mit 34 Fachsystematiken vorgestellt, die historisch aus dem zweischichtigen Bibliothekssystem hervorgegangen sind und strukturelle Ähnlichkeiten zur Library of Congress Classification (LCC) aufweisen. Der Aufbau umfasst einen allgemeinen Bereich (Buch- und Bibliothekswesen, Umweltschutz, Medien), gefolgt von Theologie, Philosophie, Pädagogik, Philologien, Kunst, Gesellschafts- und Sozialwissenschaften, Geschichte, Recht, Wirtschaft, Naturwissenschaften (Geographie, Mathematik, Geologie, Physik, Chemie, Biologie, Medizin) und schließlich Landwirtschaft, Technik und Sport. Mit 148.407 Grundnotationen (Stand 26.01.2008) ist die RVK relativ fein gegliedert, wobei die Germanistik mit 13 Gliederungsstufen die höchste Tiefe erreicht. Die Notationen bestehen meist aus einem Großbuchstaben für die Hauptklasse, einem weiteren für die Unterklasse und drei- bis sechsstelligen arabischen Zahlen. Die Hierarchie wird jedoch nicht durchgängig abgebildet, was im Vergleich zur Dewey Decimal Classification (DDC) die Trunkierung bei der Recherche erschwert. Formal- und Sachschlüssel, die in verschiedenen Systematiken ähnliche Inhalte kennzeichnen, sind vorhanden, aber eher selten und inkonsequent angewandt (z.B. Formal-, Länder-, Autoren-, Zeit- und Zahlenschlüssel).

3. RVK und SWD Thematische Überschneidungen und terminologische Kontrolle

Der Abschnitt beleuchtet die Herausforderungen bei der Harmonisierung der RVK mit der SWD. Am Beispiel des Registerbegriffs "Umweltschutz" wird gezeigt, dass dieser an mehreren Stellen der RVK auftaucht, was auf thematische Überschneidungen und die Notwendigkeit einer eindeutigen Systematisierung hinweist. Siehe-auch-Hinweise und -Verweisungen versuchen, diese Überschneidungen zu klären. Ein Großteil der RVK-Klassifikation ist jedoch nur über Klassenbenennungen zugänglich, zusätzliche Registerbegriffe fehlen. Die RVK-Online-Version verbessert die Zugänglichkeit durch eine Baumstruktur und Suchmasken für Registerbegriffe, Klassenbenennungen und Notationen. Die terminologische Kontrolle der Begriffe erfolgt über eine Festlegungskontrolle (eindeutige Deskriptoren mit Relationen wie Synonymen und hierarchischen Verweisungen) und eine Zerlegungskontrolle (Prüfung der Komposita und deren Verknüpfung mit SWD-Schlagwörtern). Die SWD wird gemäß DIN 1463 als Thesaurus klassifiziert. Die Integration der RVK-Online in verschiedene Bibliotheksverbünde (SWB, BVB, OBV) wird hervorgehoben.

4. Übergreifende Suche und die Notwendigkeit von Konkordanzen

Dieser Abschnitt beschreibt die Möglichkeiten der übergreifenden Suche in verteilten Datenbeständen über Portale wie den Karlsruher Virtuellen Katalog (KVK) und die Bielefeld Academic Search Engine (BASE). Die inhaltliche Erschließung ist jedoch oft unterschiedlich, was die Retrievalfähigkeit beeinträchtigt. Formale Erschließungsdaten werden durch Formate wie MAB und MARC sowie Schnittstellen und die Dublin Core Metadata Initiative vereinfacht, jedoch herrscht keine vollständige Homogenität. Dokumentationssprachen unterscheiden sich in Breite und Tiefe und erfordern andere Angleichungsmethoden als die Standardisierung einer einzigen Klassifikation. Crosskonkordanzen (Crosswalks, Mapping) werden als Lösungsansatz vorgestellt, um die Differenzen zu überwinden, indem sie Verbindungen zwischen Termen verschiedener Dokumentationssprachen herstellen. Diese sind bilateral und statisch und streben keine neue Standardisierung an, im Gegensatz zu Metathesauri. Konkordanzen können zwischen Thesauri (z.B. Thesaurus Sozialwissenschaften und SWD), Klassifikationen (z.B. DDC und RVK) und Dokumentationssprachen unterschiedlichen Typs (z.B. im Projekt CrissCross zwischen DDC und SWD) erstellt werden. Eine feiner unterteilte Dokumentationssprache kann leichter auf eine gröbere abgebildet werden. Die Schwierigkeiten bei der Konkordanzerstellung zwischen RVK und SWD aufgrund struktureller Unterschiede werden angesprochen.

II.Analyse der RVK und ihre Register

Die RVK, mit ihren 34 Fachsystematiken und 148.470 Grundnotationen (Stand 2008), weist eine feine Gliederung auf. Das Problem liegt in der inkonsistenten Verwendung von Schlüsseln und der unzureichenden verbalen Erschließung vieler Bereiche. Der Begriff "Umweltschutz" erscheint beispielsweise an verschiedenen Stellen in der RVK. Die RVK-Online Version bietet verbesserte Suchmöglichkeiten über Registerbegriffe, Klassenbenennungen und Notationen, mit direkter Suchmöglichkeit in Datenbanken wie dem SWB, BVB, und OBV.

1. Struktur und Umfang der RVK

Die Regensburger Verbundklassifikation (RVK) besteht aus 34 Fachsystematiken, die ihre Wurzeln im zweischichtigen Bibliothekssystem haben und strukturelle Parallelen zur Library of Congress Classification (LCC) aufweisen. Die Systematik gliedert sich in einen allgemeinen Teil (u.a. Buch- und Bibliothekswesen, Umweltschutz, Medien), gefolgt von Theologie, Philosophie, Pädagogik, Philologien, Kunst, Sozialwissenschaften, Geschichte, Recht, Wirtschaft, den Naturwissenschaften (mit Geographie und Mathematik als Ausgangspunkt) und abschließend Landwirtschaft, Technik und Sport. Die RVK ist mit 148.407 Grundnotationen (Stand 26.01.2008) sehr detailliert, wobei die Germanistik mit 13 Gliederungsstufen die höchste Tiefe aufweist. Die Notationen setzen sich in der Regel aus einem Großbuchstaben für die Hauptklasse, einem weiteren für die Unterklasse und drei- bis sechsstelligen arabischen Zahlen zusammen. Die hierarchische Struktur wird jedoch nicht konsequent abgebildet, was im Gegensatz zur Dewey Decimal Classification (DDC) die Trunkierung bei der Recherche erschwert. Zusätzliche Schlüssel (Formal-, Länder-, Autoren-, Zeit- und Zahlenschlüssel) kennzeichnen formal oder sachlich ähnliche Inhalte in verschiedenen Fachsystematiken, sind aber eher selten und inkonsequent eingesetzt.

2. Probleme der verbalen Erschließung und Registerbegriffe

Ein Hauptproblem der RVK liegt in der unzureichenden verbalen Erschließung. Obwohl die RVK-Klassen durch Registerbegriffe erweitert werden können, bleibt ein Großteil der Klassifikation nur über die Klassenbenennungen verbal zugänglich. Dies führt zu Schwierigkeiten, insbesondere bei der Recherche. Am Beispiel des Begriffs "Umweltschutz" wird verdeutlicht, dass dieser an vier verschiedenen Systemstellen auftritt (Soziologie, Wirtschaftswissenschaften, Chemie, Biologie), zusätzlich noch in Kombination mit anderen Begriffen in der Systematik "Allgemeines". Siehe-auch-Hinweise versuchen zwar, Themenkomplexe abzugrenzen, aber eine eindeutige Systematisierung ist nicht immer gewährleistet. Die inkonsistente Anwendung von Schlüsseln und die mangelnde einheitliche sprachliche Erschließung über Registerbegriffe erschweren die Navigation und Recherche innerhalb der RVK. Die Notwendigkeit einer verbesserten verbalen Erschließung, insbesondere durch eine Anreicherung der Register mit kontrolliertem Vokabular, wird deutlich.

3. Die RVK Online Version Verbesserte Suchmöglichkeiten

Die Verfügbarkeit der RVK als Online-Version verbessert die Recherche erheblich. Die hierarchische Struktur wird in der Web-Version durch eine Baumstruktur besser dargestellt. Benutzer können in den Suchbäumen browsen oder über Suchmasken nach Registerbegriffen, Klassenbenennungen oder Notationen suchen. Eine gefundene Notation ermöglicht die direkte Suche nach zugehörigen Titeln im Südwestdeutschen Bibliotheksverbund (SWB), Bibliotheksverbund Bayern (BVB), Österreichischen Bibliothekenverbund (OBV) oder einzelnen Bibliotheken. Die RVK-Online dient nicht nur RVK-Anwendern und Fachreferenten, sondern auch anderen interessierten Nutzern als hilfreiches Instrument. Der verbesserte Zugang über die Online-Version und die damit verbundenen Suchfunktionen, beispielsweise über die direkten Verknüpfungen zu verschiedenen Bibliotheksverbünden, stellt einen wichtigen Fortschritt in der Nutzbarkeit der RVK dar. Trotzdem bleiben die im vorherigen Abschnitt angesprochenen Probleme der Inkonsistenz in der Registerführung bestehen.

III.Korrelationsanalyse RVK SWD

Eine zentrale Fragestellung ist die Korrelation zwischen RVK-Notationen und SWD-Schlagwörtern. Die Analyse der Korrelationen zeigt erhebliche Unterschiede zwischen der breiten, allgemeinen Gliederung der RVK und den oft sehr spezifischen Schlagwörtern der SWD. Ein hoher Schwellenwert deutet nicht zwangsläufig auf eine sinnvolle Korrelation hin. Die Analyse identifizierte viele Übereinstimmungen, jedoch war der Anteil an Übereinstimmungen zwischen der RVK-Online Konkordanz und den Korrelationen im SWB gering (ca. 1%). Formschlagwörter erwiesen sich als wenig hilfreich für die Analyse. Die Studie zeigt auf, dass die unterschiedliche Struktur von RVK und SWD die Erstellung einer umfassenden Konkordanz schwierig gestaltet.

1. Datenquellen und Methodik der Korrelationsanalyse

Die Korrelationsanalyse untersucht den Zusammenhang zwischen der Regensburger Verbundklassifikation (RVK) und der Standardisierten Schlagwortdatei (SWD) im Südwestdeutschen Bibliotheksverbund (SWB). Die Datenbasis bildet eine Korrelationsdatei mit Rohdaten aus dem SWB, die SWD-Schlagwörter der jeweiligen Titel mit den korrelierenden RVK-Notationen verknüpft. Einbezogen wurden Titel mit sowohl RVK-Notation als auch mindestens einem Schlagwort; mehrbändige Werke wurden als Ausnahme behandelt. Ungültige RVK-Notationen und Form-, Zeit- und Körperschaftsschlagwörter wurden ausgefiltert. Ein Datensatz enthält neben der Notation und dem Schlagwort die Pica Production Number (PPN), die Anzahl der Titel mit der RVK-Notation im SWB, die Anzahl der Titel mit der Notation und dem Schlagwort, sowie einen berechneten Schwellenwert (Wahrscheinlichkeit des gemeinsamen Auftretens von Notation und Schlagwort). Dieser Schwellenwert, zwischen Null und Eins, dient als Indikator für die Stärke der Korrelation. Zwei Programme wurden eingesetzt: eines zur Datenfilterung (Festlegung der Mindestanzahl von Titeln pro Notation und des Schwellenwerts) und eines zum Abgleich der RVK-Online-Konkordanzen mit den SWB-Korrelationen, wobei drei Gruppen entstanden: Übereinstimmungen, Korrelationen nur im SWB und Konkordanzen nur in der RVK-Online.

2. Analyse der Korrelationen Schwellenwert und Aussagekraft

Die Analyse der Korrelationen zwischen RVK-Notationen und SWD-Schlagwörtern zeigte unterschiedliche Ergebnisse. Ein hoher Schwellenwert bedeutet nicht automatisch eine gute oder sinnvolle Korrelation. Am Beispiel des Schlagworts "Tragik" wird gezeigt, dass die Korrelation mit der Notation EC 3970 (Stilformen/Tragik) sehr gut (100%) ist, während die Korrelation mit EC 4730 (Tragödie) geringer ausfällt. Oft lässt sich das Sachgebiet aus Korrelationen mit hohen Schwellenwerten ableiten (z.B. "Ostafrika" und "Pflanzen" mit WL 1217). Formschlagwörter zeigen hingegen relativ unabhängig vom Schwellenwert Korrelationen, da sie die Erscheinungsform und nicht den inhaltlichen Aspekt beschreiben und in der RVK-Online inkonsistent eingesetzt werden. Auch bei hoher Korrelation ist die Aussagekraft des Schwellenwerts nicht immer eindeutig. So weist der Bereich LH 40000-LH 49910 (Kunstausstellungskataloge) nicht bei allen Titeln das Schlagwort "Ausstellung" auf (geringer Schwellenwert bei LH 44330, da dort oft das Körperschaftsschlagwort "Documenta" verwendet wird). Dieser Unterschied spiegelt die Heterogenität der Dokumentationssprachen wider: die RVK verwendet eher allgemeine Begriffe, die SWD ermöglicht spezifischere Schlagwörter.

3. Vergleich von Konkordanz und Korrelation Unterschiede und Übereinstimmungen

Der Vergleich der Korrelationen aus dem SWB mit den Konkordanzen aus der RVK-Online ergab nur wenige Übereinstimmungen (ca. 1%). Dies liegt im grundsätzlichen Unterschied der Dokumentationssprachen begründet: die SWD verwendet oft spezifische, enge Schlagwörter, während die RVK-Notationen breiter und allgemeiner gefasst sind. Die Analyse der Übereinstimmungen, Differenzen und derjenigen Einträge, die nur in einer der beiden Datenquellen vorkommen, liefert wichtige Erkenntnisse über die Unterschiede in der Struktur und der Anwendung der beiden Systeme. Die Auswertung zeigt, dass ein hoher Schwellenwert und eine große Anzahl übereinstimmender Titel nicht unbedingt eine sinnvolle Ergänzung für das RVK-Register bedeuten. Beispiele wie die Notation GK 8630 (Schiller, Friedrich von) zeigen, dass bereits übergeordnete Notationen das jeweilige Personenschlagwort enthalten könnten. Die Analyse der Fachsystematik Geographie (Gruppe R) verdeutlicht die große Anzahl an Notationen und Registerbegriffen, im Vergleich zu anderen Fachgebieten. Die unterschiedliche Granularität von RVK und SWD macht eine vollständige Konkordanz schwierig. Die Auswertung der Ergebnisse ermöglicht die Identifizierung potentieller Verbesserungen der RVK.

IV.Automatische Erschließungsverfahren und deren Anwendung

Die Arbeit beschreibt verschiedene Ansätze zur automatischen Klassifizierung von Bibliotheksbeständen, u.a. an der UB Mannheim mit einem Verfahren basierend auf fallbasiertem Schließen. Dieses Verfahren nutzt bereits klassifizierte Dokumente als Basis und erreicht eine zufriedenstellende, aber nicht perfekte Klassifikationsrate. Die Ergebnisse zeigen, dass automatische Verfahren die manuelle Sacherschließung zwar unterstützen können (z.B. bei der Retrosystematisierung), aber diese nicht vollständig ersetzen. Die Integration automatisch generierter Korrelationen zwischen RVK und SWD in den OPAC wird als sinnvolle Anwendungsmöglichkeit diskutiert, z.B. durch Tag Clouds.

1. Automatische Klassifizierung Herausforderungen und frühe Ansätze

Der Abschnitt thematisiert die automatische Klassifizierung von Dokumenten, im Gegensatz zur manuellen Klassifizierung durch Fachreferenten. Während die automatische Klassifizierung von Volltextdokumenten mithilfe statistischer Methoden verbreitet ist, gibt es nur wenige Projekte zur automatischen Klassifizierung nicht-digitaler Publikationen wie gedruckter Bücher. Die bisherigen Ergebnisse waren oft erfolglos oder schlecht dokumentiert. Erste Ansätze zur automatischen Klassifizierung von Büchern und deren bibliographischen Datensätzen entstanden bereits Ende der 1980er Jahre. Die beschriebenen Herausforderungen der automatischen Klassifizierung nicht-digitaler Medien spiegeln sich in den wenigen Projekten und den oft unbefriedigenden Ergebnissen wider. Es wird die Notwendigkeit von robusteren und besser dokumentierten Verfahren für die automatische Klassifizierung von Bibliotheksbeständen hervorgehoben.

2. Projekte zur automatischen Klassifizierung in Deutschland

In den 1990er Jahren wurde an der Universitätsbibliothek (UB) Düsseldorf im Projekt MILOS I (Maschinelle Indexierung zur erweiterten Literaturerschließung in Online-Systemen) mit dem wörterbuchbasierten Indexierungsverfahren IDX experimentiert. Im Projekt MILOS II wurde IDX optimiert und unter Nutzung der Daten aus MILOS I Versuche zur automatischen Klassifizierung unternommen. Dabei zeigte sich, dass Titelstichwörter allein nicht zur automatischen Vergabe von Notationen ausreichen. Im KASCADE-Projekt an der UB Düsseldorf wurde deshalb mit dem automatischen Verfahren THEAS (Themen-Aspekt-Identifikation) experimentiert. Die beschriebenen Projekte verdeutlichen den Forschungsstand und die Herausforderungen der automatischen Klassifizierung von Bibliotheksdaten. Die genannten Projekte (MILOS I und II, KASCADE mit THEAS) zeigen, dass die automatische Vergabe von Notationen basierend allein auf Titelstichwörtern nicht ausreichend ist, und die Notwendigkeit von weiterentwickelten Methoden wie THEAS hervorheben.

3. Automatische Klassifizierung an der UB Mannheim Fallbasiertes Schließen

An der UB Mannheim wurde im Rahmen der Umstellung auf ein einschichtiges Bibliothekssystem ein Verfahren zur automatischen Vergabe von RVK-Notationen eingeführt. Das von Magnus Pfeffer entwickelte Programm nutzt die Methode des fallbasierten Schließens. Unklassifizierte Titel erhalten automatisch eine Notation durch den Abgleich mit bereits klassifizierten Dokumenten (der Fallbasis). Nur Dokumente, die bereits über die RVK klassifiziert waren, konnten berücksichtigt werden. Zur Optimierung wurden im Hauptsachtitel Stoppwörter eliminiert und Wörter normalisiert. Ein Test mit 1000 manuell klassifizierten Titeln zeigte, dass über die Hälfte der Dokumente richtig klassifiziert wurden, ein Viertel annähernd richtig und weitere 10% zumindest dem richtigen Fach zugeordnet wurden. Die automatische Klassifizierung ist für den direkten Einsatz im OPAC noch zu fehleranfällig und stellt keine Alternative zur manuellen Klassifizierung dar. An der UB Mannheim dient sie als Hilfsmittel bei der Retrosystematisierung und der Ergänzung/Korrektur von Notationen im SWB und BVB. Weitere Versuche laufen in der Testdatenbank des SWB und mit Daten aus dem Hessischen Bibliotheks-InformationsSystem (HeBIS).

V.Anwendungsmöglichkeiten und Ausblick

Die ermittelten Korrelationen zwischen RVK und SWD bieten verschiedene Anwendungsmöglichkeiten, um die Recherche zu verbessern und die RVK für die Nutzer zugänglicher zu machen. Eine Integration in den OPAC über Tag Clouds oder die direkte Anzeige relevanter RVK-Notationen in den Suchergebnissen könnte die Benutzerfreundlichkeit deutlich steigern. Die Anreicherung der RVK-Register mit SWD-Vokabular wird als wichtiger Schritt zur Verbesserung der Sacherschließung empfohlen. Die Arbeit betont die Notwendigkeit regelmäßiger Aktualisierung und Weiterentwicklung von Dokumentationssprachen.

1. Verbesserung der Sacherschließung durch automatische Korrelationen

Die automatisch generierten Korrelationen zwischen SWD-Schlagwörtern und RVK-Notationen aus dem SWB können die manuelle Sacherschließung unterstützen. Wird einem Titel eine oder mehrere RVK-Notationen zugewiesen (automatisch oder manuell), können die korrelierenden Schlagwörter mit Schwellenwerten, PPNs und Titelanzahlen als Vorschläge ausgegeben werden. Dies erleichtert Bibliothekaren die Arbeit und verbessert die Konsistenz der Erschließung. Der Schwellenwert dient dabei als Indikator für die Wahrscheinlichkeit der Korrelation und kann als Ranking-Werkzeug eingesetzt werden. Die automatische Bereitstellung von Schlagwortvorschlägen basierend auf der RVK-Notation könnte die Effizienz der Sacherschließung deutlich erhöhen und die Qualität der Katalogdaten verbessern. Die Nutzung des Schwellenwerts als Ranking-Mechanismus ermöglicht es, die wahrscheinlichsten und relevantesten Schlagwörter zuerst anzuzeigen.

2. Integration von Korrelationen in den OPAC Tag Clouds und interaktive Suche

Die Integration der Korrelationen in den Online Public Access Catalog (OPAC) sollte nutzerfreundlich gestaltet sein. Eine einfache Hinzufügung zu den Titeldaten ist nicht optimal und kann zu Informationsüberlastung führen. Stattdessen wird der Einsatz von Tag Clouds vorgeschlagen. Diese visualisieren die korrelierenden Schlagwörter zu einer RVK-Notation, wenn ein Benutzer einen Titeldatensatz aufruft. Dies ermöglicht Anschlussrecherchen und verbessert die Auffindbarkeit von Dokumenten. Die visuelle Darstellung der Schlagwörter als Tag Cloud bietet einen interaktiven und intuitiven Zugang zu zusätzlichen Rechercheoptionen. Die Auswahl der Darstellung, z.B. im Kontext der Suchergebnisliste oder direkt im Titeldatensatz, erfordert eine Abwägung zwischen Informationsdichte und Benutzerfreundlichkeit. Allgemeinere Begriffe könnten zu Informationsüberfluss führen, während zu spezifische Schlagwörter den Nutzer in die falsche Richtung lenken könnten.

3. Verbesserter Zugang zur RVK im OPAC Umgekehrte Korrelationsnutzung

Die Integration der RVK in den OPAC könnte über die reine Notationsrecherche hinausgehen. Die Suche nach Notationen ist vielen Nutzern unbekannt oder zu aufwendig. Die automatischen Korrelationen ermöglichen einen indirekten, nutzerfreundlicheren Zugang: Bei einer Suche mit Schlagwörtern könnte der OPAC zusätzlich die korrespondierenden RVK-Notationen anzeigen, ohne dass der Nutzer explizit danach sucht. Dies verbessert die thematische Vollständigkeit der Suchergebnisse und macht die RVK für Nutzer ohne spezielle Kenntnisse zugänglich. Die Integration der RVK-Hierarchie könnte mit Elementen eines grafisch-assoziativen Browsers erfolgen. Ein Link zu Bibscout, das die SWB-Bestände nach der RVK strukturiert, könnte ebenfalls integriert werden. Durch diese Maßnahmen könnte die RVK stärker in den OPAC integriert und für einen breiteren Nutzerkreis nutzbar gemacht werden.

4. Fazit und Ausblick Weiterentwicklung und zukünftige Anwendung

Die Analyse der Korrelationen zwischen RVK und SWD lieferte unterschiedliche Ergebnisse. Formschlagwörter erwiesen sich als wenig aussagekräftig und wurden aus der Analyse ausgeschlossen. Der Schwellenwert ist nicht immer ein zuverlässiger Indikator für die Qualität der Korrelation. Die unterschiedliche Struktur der beiden Dokumentationssprachen ist deutlich geworden. Die automatisch generierten Korrelationen könnten zukünftig die Recherche mit RVK und SWD vereinfachen, insbesondere im Kontext von Web 2.0. Die Arbeit zeigt verschiedene Integrationsmöglichkeiten in den OPAC auf (z.B. Tag Clouds). Die Anreicherung der RVK-Register mit SWD-Vokabular wird als essentiell für eine verbesserte Benutzerfreundlichkeit und die Erschließung neuer Wissenschaftsgebiete erachtet. Die Weiterentwicklung der Dokumentationssprachen und deren Integration in moderne Bibliothekskataloge bleibt eine wichtige Aufgabe.

Dokumentreferenz

  • Benz, Christian: Von der formalen zur realen Einschichtigkeit der Universitätsbibliothek Mannheim. (Christian Benz)