Das National Institute for Materials Science (NIMS) hat Research Data Express (RDE) entwickelt – ein Datenmanagementsystem, das die Verarbeitung experimenteller Daten automatisiert und KI-fähige Datensätze für die Materialforschung erstellt. Das im Fachjournal Science and Technology of Advanced Materials: Methods veröffentlichte System adressiert erhebliche Herausforderungen in einem Forschungsfeld, das riesige Datenmengen produziert, die oft in herstellerspezifischen Formaten mit inkonsistenter Terminologie vorliegen, was Aggregation, Vergleich und Wiederverwendung erschwert.
Traditionelle Materialforschung zwingt Forscher dazu, beträchtliche Zeit für mühsame Aufgaben wie Formatkonvertierung, Metadatenzuweisung und Merkmalsextraktion aufzuwenden. Diese zusätzlichen Schritte behindern häufig die Datenteilung und verlangsamen den Fortschritt datengetriebener Arbeit. Das Problem hat sich verschärft, da das Feld zunehmend auf KI-gestützte Materialentdeckung angewiesen ist, die hochwertige, standardisierte Datensätze erfordert. RDE interpretiert automatisch experimentelle Daten aus Rohdateien und manuell eingegebenen Messungen, strukturiert diese Informationen neu und speichert sie in einem Format mit verbesserter Lesbarkeit.
„RDE reduziert die Belastung durch routinemäßige Datenverarbeitung für Forscher erheblich und verbessert die Auffindbarkeit, Interoperabilität, Wiederverwendbarkeit (die FAIR-Prinzipien) und Nachverfolgbarkeit von Daten“, erklärt Jun Fujima, korrespondierender Autor und Forscher am Materials Data Platform von NIMS. „Wir hoffen, dass dies die kollaborative, datengetriebene Materialforschung fördern wird.“ Die Kerninnovation des Systems ist sein „Dataset Template“-Ansatz, der definiert und steuert, wie Daten aus verschiedenen Experimenttypen verarbeitet werden sollen, anstatt einfach nur Datenformate festzulegen.
Wenn Forscher beispielsweise Tabellen mit Röntgenmessungen aus verschiedenen Quellen hochladen, kann das Dataset Template konfiguriert werden, um diese zu interpretieren. Das System führt dann automatisch erweiterte Analysen durch und erstellt Visualisierungen für sofortige Übersichten. Für verschiedene Materialforschungsthemen können mehrere Vorlagen vorbereitet werden, was maximale Flexibilität im Datenmanagement ermöglicht. Einzelforscher können bei Bedarf auch leicht benutzerdefinierte Vorlagen erstellen. Viele Vorlagen wurden bereits vorbereitet und über das System unter Nutzern geteilt.
„Der einzigartige Ansatz von RDE ermöglicht es Forschern, Datenstrukturen frei an ihre Instrumente anzupassen, während das System gleichzeitig massenhafte Datenstrukturierung und Metadatenextraktion automatisch durchführt“, sagt Fujima. Seit dem Start im Januar 2023 hat RDE erhebliche Skalierbarkeit bei breiter Akzeptanz in Japans Materialforschungsgemeinschaft gezeigt. Das System hat derzeit über 5.000 Nutzer, mit mehr als 1.900 Dataset Templates für verschiedene experimentelle Methoden, über 16.000 erstellten Datensätzen und mehr als drei Millionen gesammelten Datendateien.
RDE dient als Dateninfrastruktur für große nationale Initiativen, einschließlich der Materials Research DX Platform-Initiative des japanischen Ministeriums für Bildung, Kultur, Sport, Wissenschaft und Technologie. Um die Nutzung in der Forschungsgemeinschaft zu fördern, hat das NIMS-Team ein Open-Source-Software-Toolkit namens RDEToolKit veröffentlicht. Die Forschungsarbeit zum System ist verfügbar unter https://doi.org/10.1080/27660400.2025.2597702, und weitere Informationen zur Zeitschrift finden Sie unter https://www.tandfonline.com/STAM-M.
Die Entwicklung von RDE stellt einen bedeutenden Fortschritt in der Materialwissenschaftsinfrastruktur dar, der Entdeckungsprozesse durch reduzierte Datenverarbeitungslasten und erleichterte Zusammenarbeit beschleunigen könnte. Durch die Erstellung standardisierter, KI-fähiger Datensätze beseitigt das System einen kritischen Engpass beim Übergang des Feldes zu datengetriebenen Forschungsmethoden. Diese Infrastrukturentwicklung könnte weitreichende Auswirkungen auf Materialinnovationen in Branchen wie Elektronik, Energie, Transport und Gesundheitswesen haben, wo neue Materialentdeckungen oft technologische Durchbrüche vorantreiben.

