Galaxy ist eine Open-Source-Plattform, die es Forschenden ermöglicht, wissenschaftliche Daten mithilfe interoperabler APIs und verschiedener benutzerfreundlicher webbasierter Schnittstellen zu analysieren und auszutauschen. Das Galaxy-Projekt wurde 2005 ins Leben gerufen und hat sich seither zu einer leistungsstarken Unterstützung für Forschende in einer Vielzahl von Forschungsbereichen entwickelt, darunter *omics, Biodiversität, maschinelles Lernen, Chemieinformatik, NLP, Materialwissenschaften und Klimaforschung.
Der europäische Galaxy-Server, der am Rechenzentrum der Universität Freiburg angesiedelt ist, ist ein Vorzeigeprojekt des deutschen Netzwerks für Bioinformatik-Infrastruktur (de.NBI) und Teil mehrerer SFBs und NFDI-Konsortien. Es ist einer der größten ELIXIR-Dienste und der bevorzugte Service für mehrere EOSC Projekte (European Open Science Cloud). Seit 2022 ist die europäische Galaxy-Gemeinschaft offiziell Teil der EOSC mit ihrem eigenen Projekt namens EuroScienceGateway.
Eines der Hauptmerkmale der Galaxy-Plattform ist ihr Schwerpunkt auf Transparenz, Reproduzierbarkeit und Nachnutzbarkeit. Galaxy ist eine Multi-User-Umgebung, die das Teilen von Tools, Arbeitsabläufen (Workflows), Visualisierungen und Daten mit anderen ermöglicht. Dies macht es besonders einfach, Ergebnisse zu reproduzieren, um sie zu überprüfen und es anderen Forschern zu ermöglichen, in zukünftigen Studien darauf aufzubauen. Neben der Reproduzierbarkeit legt das Galaxy-Projekt auch großen Wert auf das Forschungsdatenmanagement (FDM). Die Plattform umfasst Tools für den Import, die Organisation, die gemeinsame Nutzung, die Kommentierung und den Export von Daten. Dies ermöglicht es Forschenden, mit großen Datensätzen zu arbeiten, ohne dass sie eine lokale Speicherinfrastruktur benötigen. Das Projekt ermutigt Nutzer*innen, ihre Daten und Analyseabläufe mit der breiteren wissenschaftlichen Gemeinschaft zu teilen, mit dem Ziel, die wissenschaftliche Forschung und Innovation voran zu treiben.
Das Galaxy-Projekt umfasst ein Trainingsnetzwerk (GTN), das mehr als 300 Tutorials für Forscher*innen, Softwareentwickler*innen, Systemadministrator*innen, Data Stewards und Daten scientists in verschiedenen Sprachen bereitstellt. Dazu gehören praktische Anleitungen, Beispieldatensätze, E-Learning-Material, Videos und Workshops, die Forschenden auf der ganzen Welt lizenzfrei zur Verfügung stehen. Das Schulungsnetzwerk wird von einer globalen Gemeinschaft unterstützt, die zur Entwicklung des Galaxy-Ökosystems beiträgt und neuen Nutzenden Unterstützung bietet. Die Zahl der Tutorials und der Mitwirkenden auf der Plattform wächst stetig, und das Themenspektrum reicht weit über die Biowissenschaften hinaus.