Dienstleistungen für den Aufbau und die Verzeichnung von Forschungsdatenrepositorien - Anforderungen aus der Praxis des KIT -

Forschungsdatenrepositorien: Aufbau & Dienstleistungen

Dokumentinformationen

Sprache German
Format | PDF
Größe 713.85 KB

Zusammenfassung

I.Forschungsdatenmanagement am KIT Anforderungen und Herausforderungen

Diese Arbeit untersucht das Forschungsdatenmanagement (FDM) am Karlsruher Institut für Technologie (KIT). Ein zentraler Fokus liegt auf Forschungsdatenrepositorien (FDRs) und deren nachhaltiger Langzeitarchivierung (LZA). Die Studie analysiert den Bedarf an FDM-Dienstleistungen am KIT, basierend auf Erhebungen aus den Jahren 2012 und 2013. Dabei wurden sowohl Befragungen als auch Interviews mit Forschern durchgeführt, um die Anforderungen an die Metadaten, die Qualitätssicherung, und die Infrastruktur zu ermitteln. Ein wichtiger Aspekt ist die Integration des Such- und Nachweisinstruments re3data.org, welches am KIT-Bibliothek entwickelt wird und persistente Identifizierer (PIs) wie DOIs unterstützt, um die Auffindbarkeit und Zitierfähigkeit von Forschungsdaten zu gewährleisten. Die Analyse deckt auf, dass ein großer Bedarf an FDM-Dienstleistungen besteht, insbesondere im Bereich der LZA und des Data Sharings. Die Studie liefert Empfehlungen zur Optimierung des FDM am KIT und zur Entwicklung von institutionellen Policies.

1. Einleitung Forschungsdatenmanagement am KIT

Die Arbeit untersucht den Bedarf und die Anforderungen an Forschungsdatenmanagement (FDM) am Karlsruher Institut für Technologie (KIT). Im Fokus steht die Optimierung des Managements von Forschungsdatenrepositorien (FDRs) und die Bereitstellung entsprechender Dienstleistungen. Als Hintergrund werden Erhebungen aus den Jahren 2012 und 2013 genannt, die den Bedarf an Verbesserungen im Umgang mit Forschungsdaten am KIT aufzeigten. Die Entwicklung des Such- und Nachweisinstruments re3data.org an der KIT-Bibliothek in Kooperation mit anderen Forschungseinrichtungen wird hervorgehoben. Durch die Ansiedlung des Entwicklerteams am KIT profitieren Forschungsgruppen von direktem Kontakt und können aktiv an der Gestaltung von re3data.org mitwirken. Dies bietet Mehrwert sowohl für die Forschungsgruppen als auch für die re3data.org-Entwickler selbst und dient dem Aufbau und der Optimierung von Forschungsdatenrepositorien. Die Notwendigkeit von Dienstleistungen durch lokale Abteilungen des Informationsmanagements, wie z.B. Bibliotheken, wird betont, um die Organisation und Sammlung der Repositorien zu gewährleisten.

2. Bestandsaufnahme Derzeitige Situation des FDM am KIT

Die Studie analysiert die derzeitige Praxis des Forschungsdatenmanagements am KIT. Eine Befragung aus dem Jahr 2012 unter Beteiligung von 25 Instituten oder Organisationseinheiten (OEs) ergab, dass nur bei 29% einheitliche Datenmanagement-Policies angewendet werden. Häufig werden Empfehlungen wie strukturierte Dateiablagen auf OE-internen Servern mit Backup verwendet. Die Übergabe von Forschungsdaten bei Mitarbeiterwechsel wird thematisiert, ebenso der Einsatz disziplinärer FDRs wie GESIS und fachspezifischer Datenstandards. Die Finanzierung der Langzeitarchivierung wird als Problem genannt. Die Mitarbeiter-Schulung zu den Policies erfolgt meist nach Bedarf. Die Einhaltung der Policies basiert größtenteils auf Freiwilligkeit. Eine spätere Befragung (2012) ergab, dass 88% der befragten Forscher an Informationen und Best-Practice-Hinweisen zu FDM oder Langzeitarchivierung (LZA) interessiert sind und entsprechende Dienstleistungen vom KIT wünschen. Insbesondere die LZA und deren Optimierung (Benutzerfreundlichkeit, Flexibilität, Leistungsfähigkeit, Interoperabilität) sowie gemeinsamer Datenzugriff (Data Sharing) wurden als wichtige Anliegen hervorgehoben. Der Wunsch nach Dienstleistungen zur Veröffentlichung als zitierfähige Publikation (z.B. über DOI) wurde ebenfalls geäußert.

3. Methoden der Datenerhebung und auswertung

Zur Ermittlung der Anforderungen an das Forschungsdatenmanagement am KIT wurden sowohl quantitative als auch qualitative Methoden eingesetzt. Im Frühjahr 2012 führte das ZAK-CODIGT und das SCC eine Befragung zu Speicherung und Langzeitarchivierung von Forschungsdaten durch, an der 25 Institute bzw. Organisationseinheiten teilnahmen. Die Auswertung erfolgte selektiv, unter Berücksichtigung der Zielsetzung der Arbeit. Die Grafiken zeigen die absoluten Originalwerte, der Text enthält gerundete Prozentwerte oder Rangfolgen. Mehrfachantworten waren möglich. Ergänzend wurden Interviews mit zehn Forschern geführt (Rücklaufquote 16%). Die Auswertung der Umfrage und der Interviews erfolgte qualitativ unter Berücksichtigung von Anonymisierungsmaßnahmen. Die Leitfragen der Interviews orientierten sich an der ersten Umfrage, den Themenbereichen aus Kapitel 2 und einer Checkliste aus dem WissGrid-Projekt, wurden aber individuell angepasst. Die Ergebnisse spiegeln die subjektiven Erfahrungen der Forscher wider.

4. Fallstudien Interviews mit KIT Forschern

Die Arbeit präsentiert Fallstudien in Form von Interviews mit Forschern verschiedener Fachbereiche am KIT. Ein Interview fokussiert auf den Bereich Analytische und synthetische Chemie und die Entwicklung des FDR „chemotion“. Die Motivation für den Aufbau resultierte aus Mängeln in der chemischen Dokumentation. Herausforderungen betrafen die Vielzahl proprietärer Programme mit unterschiedlichen Datenformaten und die Notwendigkeit der Langzeitarchivierung (LZA). Ein weiteres Interview beschreibt ein FDR im Bereich Energietechnik, wo der Umgang mit großen Datenmengen, Datenbanken (MySQL, NoSQL) und datenschutzrelevanten Informationen im Vordergrund steht. Die Herausforderungen betreffen hier die Datenstandardisierung, die Qualitätssicherung, und die Lizenzrechte. Ein drittes Interview befasst sich mit dem Forschungsbereich Architektur, Archäologie und Cultural Heritage. Hier steht die Digitalisierung und Archivierung von großen Datenmengen (fotografische Glasplatten, 3D-Modelle) im Mittelpunkt. Herausforderungen bestehen in der Digitalisierung selbst, der Erschließung der Daten nach Archivierungsstandards (ISAD(G), EAD) und der Sicherstellung der Langzeitarchivierung (LZA). Die Interviews verdeutlichen die Heterogenität der Forschungsdaten und die unterschiedlichen Anforderungen an das Forschungsdatenmanagement in den einzelnen Fachbereichen.

5. Zusammenfassung und Ausblick

Die Analyse der Ergebnisse zeigt ein heterogenes Bild des Forschungsdatenmanagements am KIT. Die geringe Rücklaufquote der zweiten Umfrage deutet auf Unsicherheit im Umgang mit dem Thema hin. Die Interviews verdeutlichen, dass viele Forscher die Dienstleistungen des KIT im Bereich FDM nicht ausreichend kennen. Die Studie empfiehlt daher, die Öffentlichkeitsarbeit zu verbessern und regelmäßige Umfragen durchzuführen. Es besteht ein Bedarf an Beratung und gebündelten Informationen zu FDM und FDRs. Die Integration von re3data.org und die Kooperation mit dem SCC für die Langzeitarchivierung werden als wichtige Schritte zur Verbesserung des FDM am KIT hervorgehoben. Ein Ausbau der Kooperation mit dem SCC und die Entwicklung adäquater LZA-Methoden in Zusammenarbeit mit ZAK-CODIGT und re3data.org werden empfohlen. Der Bedarf an weiterer Forschung und Vergleiche mit anderen Einrichtungen wird betont, ebenso wie die Berücksichtigung zukünftiger Technologien wie Linked Open Data (LOD) und virtuellen Forschungsumgebungen (VFUs).

II.Der Lebenszyklus von Forschungsdaten

Ein wesentlicher Teil der Arbeit befasst sich mit dem Lebenszyklus von Forschungsdaten. Es wird das Curation Lifecycle Model des Digital Curation Centre (DCC) vorgestellt, welches die Phasen der Datenverwaltung von der Konzeption (inkl. Data Management Plan - DMP) über die Erhebung und Auswahl (appraise and select) bis zur Speicherung, Bereitstellung (Ingest) und Langzeitarchivierung beschreibt. Die Bedeutung von Metadaten für die Interoperabilität und die Nachnutzung von Forschungsdaten wird hervorgehoben. Es werden verschiedene Metadatenstandards wie Dublin Core und DataCite Metadata-Schema diskutiert. Die Herausforderungen der Langzeitarchivierung (LZA) und die Rolle von Policies von Förderorganisationen und Verlagen werden ebenfalls thematisiert.

1. Das Curation Lifecycle Model und der Datenlebenszyklus

Für ein nachhaltiges Forschungsdatenmanagement ist die Ausrichtung kurativer Maßnahmen am Forschungsprozess und dem Lebenszyklus der Daten essentiell. Der Begriff 'digital curation' umfasst dabei sowohl Aufgaben des Forschungsdatenmanagements (FDM) als auch der Langzeitarchivierung (LZA). Das Dokument beschreibt bestehende Herausforderungen im bisherigen Publikationsprozess von Forschungsdaten. Als Beispiel wird das Curation Lifecycle Model des Digital Curation Centre (DCC) präsentiert, welches das ideale Datenmanagement fokussiert und im Gegensatz zum Data Curation Continuum des Australian National Data Service, welches existierende Zusammenhänge bei der Veröffentlichung beschreibt, ein ideales Vorgehen skizziert. Das DCC Modell unterscheidet sequentielle Maßnahmen (z.B. Ingest), andauernde Maßnahmen (z.B. Preservation Planning) und gelegentliche Maßnahmen (z.B. Dispose). Es beschreibt Phasen wie die Konzeptionsphase (Conceptualize), in der ein Data Management Plan (DMP) erstellt wird und die Bedeutung der Standardisierung für die Interoperabilität hervorgehoben wird, die Erstellung oder den Erhalt von Rohdaten (Create-or-Receive), die Bewertung und Selektion der Daten (Appraise and Select) und deren Übergabe an ein Repositorium (Ingest). Weitere Phasen sind die Preservation Actions, das Speichern und die Maßnahmen für den Zugang, die Nutzung und die Wiederverwendung (Access, Use and Reuse) sowie die Transformation und mögliche Weiterverarbeitung (Transform).

2. Metadaten und Standards im Datenlebenszyklus

Ein wichtiger Aspekt im Datenlebenszyklus ist der Umgang mit Metadaten. Es werden verschiedene Metadatentypen unterschieden: identifizierende/beschreibende, administrative und technische Metadaten. Ihre Erfassung kann manuell, semi- oder vollautomatisch erfolgen. Die Bedeutung von Metadaten für die sinnvolle Nachnutzung von Forschungsdaten wird betont; sie bilden das Bindeglied zwischen den Forschungsdaten und der Infrastruktur (Repositorien) und beeinflussen die Datenqualität. Die Vielfalt der Metadaten unterstreicht die Notwendigkeit von Standardisierung für die digitale Langzeitarchivierung (dLZA), um Interoperabilität und Kompatibilität zu gewährleisten. Die Tendenz geht zu offenen Standards wie XML. Als grundlegende Metadatenstandards werden der Dublin Core und das DataCite Metadata-Schema genannt, ergänzt durch fachspezifische Frameworks wie DDI (Sozialwissenschaften) oder CERA-2 (Klimaforschung). Für die inhaltliche Erschließung können auch bibliothekarische Klassifikationen (z.B. DDC) oder Thesauri genutzt werden. Wichtige Metadatenstandards in der dLZA sind PREMIS, LMER und METS, wobei METS direkt in das OAIS-Referenzmodell eingebunden werden kann.

3. Policies Förderorganisationen und der Datenlebenszyklus

Policies von Förderorganisationen und Verlagen spielen eine entscheidende Rolle im Datenlebenszyklus. Die Deutsche Forschungsgemeinschaft (DFG) fordert beispielsweise die Aufbewahrung von Primärdaten für mindestens zehn Jahre. Sie fördert den Aufbau von Forschungsdatenrepositorien (FDRs) und betont die Bedeutung des Datenmanagements in Forschungsanträgen. Auch Verlage befassen sich zunehmend mit Policies zur Qualitätssicherung von Forschungsdaten (Peer Review) und zur Datenveröffentlichung. Zeitschriften mit expliziten Richtlinien zum Umgang mit Daten weisen oft einen höheren Impact-Faktor auf. Journal-Policies fokussieren meist die Ablage in geeigneten Repositorien oder eine persistente Referenzierung. Open Access kann als Voraussetzung für die Veröffentlichung gefordert werden. Die Arbeit diskutiert auch Aspekte des rechtlichen Schutzes von Forschungsdaten, die Rolle von Drittmittelgebern und die Übertragung von Nutzungsrechten in Arbeitsverhältnissen. Für die Veröffentlichung und Nachnutzung durch Dritte wird der Abschluss von Lizenzverträgen mit Verschwiegenheitsklausel empfohlen.

4. Publikation Referenzierung und der Datenlebenszyklus

Traditionell wurden Forschungsdaten in Textpublikationen integriert. Der digitale Fortschritt ermöglicht zusätzliche Veröffentlichungsformen, z.B. auf Verlagsplattformen mit oder ohne persistente Adressierung, oder in externen Repositorien. Kooperationen zwischen Verlagen und Repositorienbetreibern werden hierfür als notwendig angesehen. Beispiele hierfür sind die Anreicherung von Elsevier ScienceDirect Artikeln mit Daten in PANGAEA und die Zusammenarbeit von Dryad mit mehreren Verlagen. Mit der Zunahme digitaler Objekte wird eine dauerhafte, eindeutige Adressierung und Versionierung unabdingbar. Persistente Identifizierer (PIs) wie DOI, Handle, ARC, PURL und URN gewährleisten standortunabhängige Identifizierung und exakte Zitierung, was auch für die Langzeitarchivierung (LZA) wichtig ist. Das DOI-System wird als gut geeignetes Beispiel für Forschungsdaten vorgestellt. Forschungsdaten können als eigenständiges Objekt in einem Repositorium, mit textueller Dokumentation oder als Anreicherung einer Textpublikation veröffentlicht werden.

III.Forschungsdatenrepositorien FDRs am KIT und international

Die Arbeit untersucht verschiedene Aspekte von Forschungsdatenrepositorien (FDRs). Es werden verschiedene Arten von FDRs, wie disziplinäre und institutionelle Repositorien, vorgestellt. Der Aufbau und die Funktionalität von FDRs werden im Detail beschrieben, inklusive technischer Funktionen wie Speicherkonzepte, Metadatenverwaltung und Authentifizierungsmechanismen. Die Rolle von Bibliotheken im Forschungsdatenmanagement wird beleuchtet, wobei ein Pyramidenmodell der FDM-Aktivitäten von Bibliotheken vorgestellt wird. Das am KIT entwickelte re3data.org wird als Beispiel für ein globales Register von FDRs genannt, mit ca. 650 verzeichneten Repositorien. Die Arbeit vergleicht auch internationale Praktiken, z.B. im Vereinigten Königreich (JISC-Programme), um Best-Practice-Beispiele zu identifizieren.

1. Definition und Charakteristika von Forschungsdatenrepositorien FDRs

Der Abschnitt definiert Forschungsdatenrepositorien (FDRs) und beschreibt ihre Funktionen. FDRs werden als Systeme beschrieben, die Forschungsdaten speichern, verwalten und zugänglich machen. Sie ermöglichen Data Sharing innerhalb wissenschaftlicher Communities und tragen zur Langzeitarchivierung (LZA) bei. Die Anzahl der FDRs im Web wird auf tausende geschätzt, mit steigender Tendenz. Häufig findet man FDRs in den Bereichen Geowissenschaften, Medizin, Biologie, Astronomie und Sozialwissenschaften. Viele FDRs befinden sich möglicherweise in der 'shared domain', sind aber nicht öffentlich sichtbar. Die technischen Funktionen von FDRs umfassen Speicherkonzepte für digitale Objekte, Metadatenverwaltung (inkl. persistenter Identifizierer - PIs), Datentransfer (Ingest-Workflow, Schnittstellen zur Nachnutzung) und Authentifizierungs- und Autorisierungsmechanismen. Die Systemarchitektur kann in Schichten dargestellt werden, wobei in der Persistenzschicht datensatzorientierte (Datenbanken) und dateiorientierte Konzepte unterschieden werden. Hybridsysteme, Grid- und Cloud-Technologien sind ebenfalls möglich. Als Softwaresysteme für FDRs werden EPrints, DSpace, Fedora und iRODS genannt – meist Open-Source-Systeme, die oft aus Dokumentenservern entstanden sind. Neben disziplinären (z.B. PANGAEA) gibt es auch interdisziplinäre FDRs (z.B. figshare).

2. Arten von FDRs und ihre Rolle im Forschungsdatenmanagement

Der Text unterscheidet verschiedene Arten von Forschungsdatenrepositorien (FDRs). Institutionelle Repositorien werden als Sammlungen von Forschungsergebnissen mit einem gemeinsamen Bezug zu einer Institution (meist durch Autorschaft) beschrieben. Sie decken in der Regel mehrere Disziplinen ab, haben verschiedene Geldgeber und unterstützen Communities mit unterschiedlichen Ansätzen zur Forschungsverbreitung. Die obligatorische Ablage von Inhalten wird von jeder Institution individuell entschieden. Die Institutionen können verschiedene Anforderungen an die Inhalte des Repositoriums haben, von Open Access über Metriken bis hin zu anderen Aspekten. Die Rolle von Bibliotheken im FDM wird im Zusammenhang mit einem Pyramidenmodell beschrieben, welches vier Ebenen von FDM-Aktivitäten von Bibliotheken darstellt – von institutionellen bis hin zu übergreifenden Aufgaben. Zu den wichtigen Aufgaben zählen Policyentwicklung (national, institutionell) und der Ausbau lokaler Kapazitäten zur Datenkuratierung (develop local data curation capacity), was als FDR-Management und Langzeitarchivierung interpretiert wird. Eine Digital Repository Audit Method Based on Risk Assessment (DRAMBORA) am DCC wird erwähnt.

3. re3data.org und internationale Praktiken

Ein Schwerpunkt liegt auf re3data.org, einem globalen, interdisziplinären, webbasierten Verzeichnis von Forschungsdatenrepositorien (FDRs), das von der KIT-Bibliothek in Kooperation mit der Humboldt-Universität Berlin und dem GeoForschungszentrum Potsdam entwickelt wird (DFG-Projekt). Derzeit sind ca. 650 FDRs verzeichnet, davon knapp 600 im eigenen Schema erschlossen. Das Schema bildet die Eigenschaften eines FDR möglichst umfassend ab und visualisiert wichtige Kriterien durch Icons. Im Vergleich zu ähnlichen Initiativen wie dem Datenbank-Infosystem (DBIS) der Universitätsbibliothek Regensburg, welches hauptsächlich bibliografische Datenbanken verzeichnet, fokussiert sich re3data.org auf FDRs. Der Text analysiert auch internationale Praktiken des FDM, insbesondere am Beispiel des Vereinigten Königreichs (JISC-RDM-Programme). Eine vergleichende Analyse von sechs JISC-Projekten zeigt die wichtigen Aufgaben von Bibliotheken im FDM: umfassender Service, Trainingsprogramme, Management von FDRs, Entwicklung von Metadaten-Sets und Policies, Evaluierung des Bedarfs und die sich ergebenden Dienstleistungen. Die Bibliotheken übernahmen in der Hälfte der Fälle die Projektleitung.

IV.Erhebungsergebnisse und Analyse der Anforderungen

Die Studie basiert auf zwei Umfragen (2012 und 2013) und Interviews mit Forschern am KIT. Die Befragungen zeigen einen hohen Bedarf an FDM-Dienstleistungen, insbesondere im Bereich der Langzeitarchivierung (LZA) und des Data Sharings. Die Interviews liefern detaillierte Einblicke in die Herausforderungen des FDM in verschiedenen Disziplinen am KIT. Es werden Beispiele für existierende FDRs am KIT (z.B. chemotion) vorgestellt. Die Ergebnisse zeigen, dass die Forscher besonders an Informationen zu Best Practices, Metadatenstandards, rechtlichen Aspekten und der technischen Infrastruktur interessiert sind. Die geringe Rücklaufquote der Umfrage 2013 wird als Indiz für Unsicherheit gegenüber der Thematik interpretiert. Zusammenfassend lässt sich sagen, dass die Ergebnisse einen hohen Bedarf an Unterstützung und Beratung im Forschungsdatenmanagement am KIT aufzeigen.

1. Befragung 2012 Bestandsaufnahme des Forschungsdatenmanagements am KIT

Im Frühjahr 2012 führte das ZAK-CODIGT und das SCC (Service Center Computing) eine Befragung zur Speicherung und Langzeitarchivierung (LZA) von Forschungsdaten durch. 25 Institute und Organisationseinheiten (OEs) am KIT beteiligten sich. Die Ergebnisse zeigen, dass nur bei 29% der OEs einheitliche Policies für das Datenmanagement angewendet werden; in anderen Fällen orientiert man sich an der guten wissenschaftlichen Praxis oder an Standards wie ISO 9001. Empfehlungen umfassen strukturierte Dateiablagen auf OE-internen Servern mit Backup durch das SCC. Vorgaben zur Datenübergabe bei Mitarbeiterwechsel und der Einsatz disziplinärer FDRs (z.B. GESIS) werden genannt. Fachspezifische Datenstandards werden in einigen Forschungsgruppen verwendet. Die Finanzierung der Langzeitdatenspeicherung stellt ein Problem dar. Die Mitarbeiterschulung zu den Policies erfolgt größtenteils nach Bedarf, deren Einhaltung basiert meist auf Freiwilligkeit. Die Befragung ergab ein hohes Interesse (88%) der Forscher an Informationen und Best-Practice-Hinweisen zu FDM und LZA, sowie an entsprechenden Dienstleistungen vom KIT, insbesondere für die LZA und Data Sharing, mit möglichen Lösungen wie einem zentralen Datenbanksystem mit Webinterface oder FTP, inklusive Authentifizierung und Autorisierung. Der Bezug einer finanziellen Ersparnis wurde vereinzelt genannt.

2. Befragung 2013 und Interviews Vertiefende Analyse der Anforderungen

Eine weitere Erhebung im Jahr 2013 umfasste sowohl eine Umfrage als auch Interviews. Die Umfrage hatte eine niedrige Rücklaufquote (16%), was auf Unsicherheit gegenüber der Thematik hindeuten könnte. Technische Probleme mit der PDF-Funktionalität der Umfrage und die Wahrnehmung, dass sich seit der vorherigen Erhebung nichts geändert habe, werden als mögliche Gründe genannt. Die Befragten nutzten re3data.org wenig zur Suche nach FDRs. Die Interviews befragten Forscher zu ihren Erfahrungen mit Forschungsdatenrepositorien (FDRs). Vier Forscher betreiben kein eigenes FDR, drei nutzen lokale Speichersysteme, und drei nutzen eigene FDRs, teilweise bereits in re3data.org verzeichnet (z.B. chemotion, KCDC). Die wichtigsten Kriterien für die Beschreibung eines FDRs aus Sicht der Befragten waren: technische Aspekte (Verfügbarkeit, Performance, Benutzerfreundlichkeit, Suchfunktionen, Verlinkung); rechtliche Aspekte (Datenschutz, Nutzungsrechte, Authentifizierung/Autorisierung); Metadaten und Dokumentation (Erhebungsmethodik, Datenformate, -typen, Verfasser, Datum); und Datenqualität (peer reviewed, Aktualität, Vollständigkeit). Die Interviews zeigten ebenfalls die Notwendigkeit einer Langzeitarchivierung (LZA).

3. Analyse der Erhebungsergebnisse und Schlussfolgerungen

Die Analyse der Erhebungen von 2012 und 2013 zeigt einen deutlichen Bedarf an Forschungsdatenmanagement (FDM)-Dienstleistungen am KIT. Die niedrige Rücklaufquote der 2013er Umfrage und die geringe Nutzung von re3data.org deuten auf Wissenslücken der Forscher über die angebotenen Dienstleistungen hin. Die Ergebnisse der Interviews zeigen die Heterogenität der Forschungsdaten und der Anforderungen an FDRs. Die Studie betont die Notwendigkeit von Maßnahmen zur Steigerung der öffentlichen Wahrnehmung des Themas am KIT. Es wird eine regelmäßige Durchführung und Ausweitung solcher Umfragen empfohlen, ähnlich den positiven Erfahrungen an der Universität Oxford. Die Forscher wünschen sich Beratung und gebündelte Informationen. Die Analyse der wichtigsten Kriterien zur Beschreibung eines FDRs aus Nutzersicht zeigt eine hohe Übereinstimmung mit dem Icon-System von re3data.org, mit Schwerpunkt auf technischen Aspekten. Die Studie schließt mit einem Ausblick auf weitere Forschung und die Berücksichtigung zukünftiger Technologien.

V.Schlussfolgerungen und Ausblick

Die Analyse der Erhebungsergebnisse führt zu konkreten Empfehlungen zur Verbesserung des Forschungsdatenmanagements (FDM) am KIT. Dies beinhaltet die Stärkung der Langzeitarchivierung (LZA) in Kooperation mit dem SCC (Service Center Computing), die Weiterentwicklung von FDM-Dienstleistungen, die Verbesserung der Kommunikation und Beratung von Forschern, sowie die Integration von re3data.org in die FDM-Strategie des KIT. Die Studie verweist auf den Bedarf für weitere Forschung, z.B. durch Vergleiche mit anderen Forschungseinrichtungen. Zukünftige Entwicklungen im Bereich Linked Open Data (LoD) und virtueller Forschungsumgebungen (VFUs) werden als relevante Faktoren für das Forschungsdatenmanagement erwähnt. Die Ergebnisse können auch für andere Institutionen als Hilfestellung für die Optimierung ihres eigenen FDM dienen.

1. Zusammenfassung der Erhebungsergebnisse

Die Erhebungsergebnisse aus den Umfragen (2012 und 2013) und den Interviews zeigen einen klaren Bedarf an verbessertem Forschungsdatenmanagement (FDM) am KIT. Die 2012er Umfrage unter 25 Instituten/Organisationseinheiten (OEs) ergab, dass nur bei 29% einheitliche Datenmanagement-Policies existieren. Häufig werden interne Serverlösungen mit Backup genutzt. Die Finanzierung langfristiger Datenspeicherung stellt ein Problem dar. Eine hohe Nachfrage (88%) nach Informationen, Best Practices und Dienstleistungen im Bereich FDM und Langzeitarchivierung (LZA) wurde festgestellt. Besonders gewünscht werden Verbesserungen der LZA (Ausbau, Benutzerfreundlichkeit, Flexibilität, Leistungsfähigkeit, Interoperabilität) und gemeinsamer Datenzugriff (Data Sharing). Die 2013er Umfrage hatte eine geringe Rücklaufquote (16%), was auf Unsicherheit im Umgang mit dem Thema hindeutet. Technischen Probleme und die Wahrnehmung, dass sich seit der vorherigen Umfrage nichts geändert habe, werden als mögliche Gründe genannt. Die Interviews befragten Forscher zu ihren Erfahrungen mit FDRs und zeigten auf, dass viele Forscher die Dienstleistungen des KIT nicht kennen. Die Interviews lieferten detaillierte Einblicke in die Herausforderungen des FDM in verschiedenen Disziplinen.

2. Analyse der Anforderungen an das Forschungsdatenmanagement

Die Interviews ergaben, dass die wichtigsten Kriterien zur Beschreibung eines FDRs aus Nutzersicht technische Aspekte (Verfügbarkeit, Performance, Benutzerfreundlichkeit, Suchfunktionen, Verlinkung), rechtliche Aspekte (Datenschutz, Nutzungsrechte, Authentifizierung/Autorisierung), Metadaten und Dokumentation (Erhebungsmethodik, Datenformate, -typen, Verfasser, Datum) und Datenqualität (peer reviewed, Aktualität, Vollständigkeit) sind. Die Ergebnisse korrelieren stark mit dem Icon-System von re3data.org. Die Analyse zeigt, dass viele Forscher nicht genau wissen, welche Dienstleistungen das KIT und die KIT-Bibliothek im Bereich FDM und FDRs anbieten. Die Erhebungen evaluierten die Thematik „Forschungsdaten am KIT“ und die entsprechenden Anforderungen der Forscher exemplarisch. Die Umfragen können auch als Maßnahme der KIT-internen Öffentlichkeitsarbeit gesehen werden. Es wird ein Bedarf an Beratung und gebündelten, fundierten Informationen festgestellt. Die geringe Nutzung von re3data.org zur FDR-Recherche zeigt den Bedarf an Verbesserungen der Wissensvermittlung.

3. Empfehlungen und zukünftige Forschungsdesiderate

Basierend auf den Ergebnissen werden Empfehlungen für das weitere Vorgehen am KIT ausgesprochen. Dazu gehört die Verbesserung der KIT-internen Öffentlichkeitsarbeit zum Thema Forschungsdatenmanagement (FDM) und die regelmäßige Durchführung von Erhebungen. Die Stärkung der Langzeitarchivierung (LZA) in Kooperation mit dem Service Center Computing (SCC) wird empfohlen, ebenso wie die Weiterentwicklung von FDM-Dienstleistungen und die verbesserte Kommunikation und Beratung von Forschern. Die Integration von re3data.org in die FDM-Strategie des KIT wird als wichtiger Schritt gesehen. Weitere Forschungsarbeiten werden vorgeschlagen, zum Beispiel durch einen Vergleich mit ähnlichen Einrichtungen (Forschungszentrum Jülich, Fraunhofer-Gesellschaft, Max-Planck-Gesellschaft) und internationalen Organisationen. Kommerzielle Anbieter wie Google, WolframAlpha und Elsevier werden als potentielle Servicepartner genannt. Die Rolle von Verbundzentralen wie dem BSZ (Bibliotheksservice-Zentrum Baden-Württemberg) muss neu überdacht werden. Technologien wie Linked Open Data (LOD) und virtuelle Forschungsumgebungen (VFUs) bieten zukünftig neue Möglichkeiten, deren Integration in die FDM-Strategie zu prüfen ist. Die Ergebnisse des bwFDM-Projekts (Forschungsdatenmanagement Baden-Württemberg) können weitere Erkenntnisse liefern.

Dokumentreferenz

  • AGU Publications Data Policy (American Geophysical Union)
  • Evolution der Informationsinfrastruktur. Forschung und Entwicklung als Kooperation von Bibliothek und Fachwissenschaft (Neuroth, Heike; Lossau, Norbert; Rapp, Andrea (Hrsg.))