Aufbau einer Einrichtung : Forschungsdaten werden recycelt

Die Forschung entdeckt Nachhaltigkeit für sich: Wissenschaftliche Daten sollen künftig nach Ende eines Projektes nicht mehr verschwinden.

Ein neuer Nachhaltigkeitstrend verbreitet sich in der deutschen Wissenschaft: das Recycling von Forschungsdaten. Für ihre Wiederverwendung wird gerade eine neue vernetze Einrichtung aufgebaut: Die Nationale Forschungsdateninfrastruktur (NFDI), die aus rund 30 Konsortien aus Hochschulen, Forschungsinstituten und Rechenzentren besteht. Ihre Mission: Aus Forschungsrohdaten, die bereits einmal für wissenschaftliche Experimente erhoben worden waren, mit fortgeschrittenen Computertechnologien neue Fragestellungen und Erkenntnisse zu gewinnen.

Direktor der Nationalen Forschungsdateninfrastruktur ist seit März York Sure-Vetter, Informatikprofessor am Karlsruher Institut für Technologie (KIT). „Es gibt Zehntausende von Studien, die in dieser Hinsicht eine Auswertung lohnen“, sagt Sure-Vetter, der auf ausgewiesene Forschungs­erfahrungen in den Bereichen künstliche Intelligenz (KI) und Data Science zurückgreifen kann.

Denn KI und Hochleistungsrechenzentren sind heute die Mittel der Wahl, um frische Daten zu bündeln, aber auch den teilweise schon bejahrten Forschungsdaten neues Leben einzuhauchen. Das Problem: nahezu alle öffentlich geförderten Forschungsprojekte – egal ob in den Sozial-, Natur- oder Ingenieurwissenschaften –, für die per Fragebogen oder mittels Sensoren Daten erhoben werden, kümmern sich nach Abschluss des Projektberichts nicht mehr um diese „Rohdaten“.

Sie werden in den Instituten nach dem Weggang des Doktoranden oder der Emeritierung des Professors schlichtweg vergessen oder schlimmstenfalls gelöscht. Um dieser Datenverschwendung Einhalt zu gebieten, wurde von den Wissenschaftsministerien des Bundes und der Länder die NFDI als neue Serviceeinrichtung auf den Schild gehoben.

Mit Unterstützung der Deutschen Forschungs­gemeinschaft (DFG) wurden an die 30 Themenfelder definiert, zu denen künftig Forschungsdaten zentral gesammelt werden. Derzeit werden Konsortien gebildet, die im Wettbewerb um die jährlich 90 Millionen Euro Anschubfinanzierung konkurrieren. Ende Juni wurden die ersten neun NFDI-Konsortien durch die Gemeinsame Wissenschafts­kommission (GWK) von Bund und Ländern ausgewählt.

So fungiert das Konsortium „NFDI4Health“ künftig als Nationale Forschungsdaten­infrastruktur für personenbezogene Gesundheitsdaten. Weitere Daten-Hubs wurden für die Sozial-, Bildungs-, Verhaltens- und Wirtschaftswissenschaften, zu materiellen und immateriellen Kulturgütern, für die Pflanzen-Grundlagenforschung, die chemische Katalyse, die Ingenieurwissenschaft sowie für Biodiversität, Ökologie und Umweltdaten benannt.

Vier der neun bewilligten Anträge kommen aus den Lebenswissenschaften. An den Konsortien sind die Hochschulen mit 45 Prozent am stärksten vertreten; Helmholtz-Gemeinschaft, Leibniz-Gemeinschaft und die Akademien der Wissenschaften partizipieren an jeweils 11 Prozent der Verbünde.

Die meisten NFDI-Zentren wurden an wissenschaftliche Träger in Baden-Württemberg vergeben (3), Nordrhein-Westfalen ist mit zwei Konsortien dabei. Jeweils eine Förderung erhalten Bremen, Hessen, Rheinland-Pfalz und Thüringen, dem einzigen ostdeutschen Bundesland in der Auswahl.

Standardisierte Vorgehensweise

Die GWK folgte mit ihrer Entscheidung den Vorschlägen der Deutschen Forschungsgemeinschaft (DFG), die eine Auswahl aus insgesamt 22 Bewerbungen auf die NFDI-Ausschreibung getroffen hatte. Zu den ersten Aufgaben der Konsortien zählt nach den Worten des stellvertretenden GWK-Vorsitzenden und Minister für Wissenschaft, Weiterbildung und Kultur des Landes Rheinland-Pfalz, Konrad Wolf, „die Entwicklung von disziplinübergreifenden Metadaten­standards oder die Etablierung von Prozessen zum standardisierten Umgang mit Forschungsdaten“.

Die NFDI stelle eine Innovation dar, die „eine Breitenwirkung im gesamten Wissenschaftssystem entfalten“ werde, so Wolf. Zu den Konsortien zählt DataPLANT unter der Leitung der Universität Freiburg, das in den kommenden fünf Jahren insgesamt circa elf Millionen Euro von der DFG erhält. Partnerinstitutionen sind die Universität Tübingen, das Forschungszentrum Jülich und die Technische Universität Kaiserslautern. Aufgabe ist es, neben der Sammlung großer Datenmengen aus der modernen Pflanzenforschung auch Methoden zu entwickeln, wie sich die digitale Flora für unterschiedliche Nutzungsbereiche mittels KI auswerten lassen – ob zur Ertragssteigerung von Getreide oder zur Klimaresistenz.

„Im Fehlen einer nationalen Infrastruktur sehen wir bislang ein wesentliches Hindernis auf dem Weg, das volle Potenzial der Pflanzenforschung in Europa ausschöpfen zu können“, erklärte Ralf Reski, Professor für Pflanzenbiotechnologie an der Universität Freiburg, nach der erfolgreichen Ernennung des DataPLANT-Verbundes.

In Bremen fördert die DFG bereits seit 2013 das Projekt GFBio (German Federation for Biological Data), das Datenzentren für Nukleotid- und Umweltdaten umfasst sowie die sieben etablierten Datenzentren der größten naturwissenschaftlichen Forschungseinrichtungen Deutschlands. Hinzu kommt die weltweit vielfältigste mikrobiologische Ressourcen­sammlung. Auf diesen Erfahrungen baut das Konsortium NFDI4BioDiversity auf.

Kuturwissenschaftlicher Schwerpunkt

Das Netzwerk soll nun um das Netz der Botanischen Gärten und die größten Sammlungen von Nutzpflanzen und deren wilden Verwandten erweitert werden. NFDI4BioDiversity wird ab Herbst 2020 mit bis zu 25 Millionen Euro für zunächst fünf Jahre gefördert. Beteiligt sind 49 universitäre und außeruniversitäre Partnereinrichtungen in ganz Deutschland.

Einen kulturwissenschaftlichen Schwerpunkt hat das Konsortium NFDI4Culture, an dem die Abteilung für Digitale Musikwissenschaft der Uni Paderborn beteiligt ist. Ziel der Forscher ist es, geisteswissenschaftliche Forschungsfragen durch digitale Methoden zu beantworten. Dazu gehört insbesondere die digitale Verarbeitung von Texten, Notenmaterial, Abbildungen, Audio- und Videoaufnahmen sowie weiteren Quellen. Das Konsortium sammelt sowohl 2D-Digitalisate von Gemälden, Fotografien und Zeichnungen als auch digitale 3D-Modelle kulturhistorisch bedeutender Gebäude, Denkmäler oder audiovisuelle Daten von Musik-, Film- und Bühnenaufführungen. „Für uns ist es von zentraler Bedeutung, die kontinuierliche Zusammenarbeit auf Augenhöhe und den regelmäßigen Transfer innovativer Forschungsergebnisse in die Fächer, wie auch in die Kulturpolitik, die Kulturwirtschaft und die interessierte Zivilgesellschaft voranzutreiben“, betonen die Verantwortlichen.

Das Konsortium NFDI4Chem unter der Leitung der Friedrich-Schiller-Universität Jena (FSU) will die Digitalisierung aller Bereiche der chemischen Forschung vorantreiben. „Wir werden am frühestmöglichen Zeitpunkt im Forschungsprozess, nämlich bei der Planung von Experimenten und ihrer Durchführung im Labor ansetzen und die Daten in elektronischer und wiederverwendbarer Form erfassen“, sagt der Jenaer Chemieinformatiker Professor Christoph Steinbeck als Sprecher der Gruppe mit 27 universitären und außeruniversitären Partnern.

„Von dort fließen die Daten noch vor ihrer Verwertung in lokale, nationale und internationale Repositorien, um ihre Wiederverwendbarkeit zu fördern und die Validierung der Forschung zu ermöglichen.“ Und er erwartet, dass dies auch den Publikationsprozess in der Wissenschaft verbessern werde.