BioMedIT – ein sicheres IT-Netz für die verantwortungsvolle Verarbeitung von Gesundheitsdaten zu Forschungszwecken
Katrin Crameri
Täglich forschen Wissenschaftler:innen weltweit an innovativen Behandlungsmethoden für unzählige Krankheiten. Ihre Arbeit basiert auf grossen, immer vielfältigeren Datenmengen, bietet jedoch ein riesiges Potenzial für die Medizin und das Gesundheitswesen im Allgemeinen. Da hierbei streng vertrauliche Personendaten verarbeitet werden, müssen Forscher besondere Vorkehrungen treffen. Erst dadurch können diese Daten ethisch korrekt und gesetzeskonform verwendet werden. Die Frage ist also: Wie kann man den Nutzen dieser Daten maximieren und dabei die Risiken für Patient:innen und datenliefernde Spitäler minimieren?
Die 2017 gestartete Initiative SPHN (Swiss Personalized Health Network) hat das Ziel, Patientendaten aus den fünf Uni-Spitälern der Schweiz für die nationale Forschung nutzbar zu machen. Um die Interpretierbarkeit der Daten zu gewährleisten, müssen diese standardisiert und strukturiert aufbereitet werden. Dies erfolgt direkt am Ort der Datenspeicherung. Die Spitäler überführen die Daten aus ihren individuellen IT-Systemen in eine Datenplattform (bzw. ein Data Warehouse oder Data Lake), um die Sekundärnutzung dieser Daten zum Beispiel für die Forschung zu ermöglichen. Damit Forschenden eine sichere und geschützte Umgebung zur Verarbeitung von sensiblen Daten zur Verfügung steht, wurde BioMedIT geschaffen – ein Netzwerk für den landesweiten Austausch von Gesundheitsdaten für die Forschung.
BioMedIT im Detail
Das BioMedIT Netzwerk basiert auf den modernen und sicheren Cloud-Umgebungen der Universität Basel, der ETH Zürich und der Universität Lausanne. An jedem dieser drei Knotenpunkte können Daten von Anbietern wie Spitälern und Forschungsorganisationen verschlüsselt auf die Plattform übertragen werden. Projekte von Forschungskonsortien oder einzelnen Forschenden, die sensible Daten nutzen wollen, werden als Forschungsprojekte an einem der Knotenpunkte in einer projektspezifischen BioMedIT-Umgebung, dem so genannten B-Space, eingerichtet. Die Forschenden greifen über eine Zwei-Faktor-Authentifizierung sicher auf das System zu und extrahieren nur die nicht sensiblen oder aggregierten Forschungsergebnisse, während die sensiblen Daten in der Plattform verbleiben.
Das Schweizerische Institut für Bioinformatik (SIB) ist für die technische Umsetzung dieser Initiative verantwortlich. BioMedIT profitiert dabei von der technischen Kompetenz des SIB, welche auf jahrzehntelanger Erfahrung im Bereich der Bioinformatik-Infrastrukturen aufbaut.
Die gemeinsame Reise beginnt
Wir schreiben das Jahr 2020. Zu diesem Zeitpunkt waren bereits erste Versionen der Desktop-Applikation für die Datenverschlüsselung, den Datentransfer und die Entschlüsselung (sett, secure encryption and transfer tool) sowie der web-basierten User- / Projekt-Management Lösung (BioMedIT Portal) verfügbar. Diese waren wie das gesamte Projekt jedoch in einem sehr frühen Stadium. Für die Erweiterung und Umsetzung des BioMedIT Portals suchte das SIB Unterstützung und fand diese bei Karakun. Katrin Crameri, Direktorin Personalisierte Gesundheitsinformatik beim SIB erläutert: «Wir haben damals mit Christian Ribeaud einen kompetenten und von der Community sehr geschätzten Mittelsmann gefunden, der uns bei der Weiterentwicklung der zentralen BioMedIT Tools tatkräftig unterstützt hat. So tatkräftig, dass wir ihn – entgegen der Planung – bis zum Ende des Projektes nicht mehr haben abgeben wollen».
Einführung von Scrum als Grundlage
Zu Beginn der Zusammenarbeit war die Corona-Pandemie das vorherrschende Thema. Massnahmen zum Schutz der Bevölkerung wurden von Seiten der Regierung verschärft, der nächste Lockdown stand kurz bevor. Schlechte Voraussetzungen für ein kollaboratives Software-Projekt. Da jeder der drei Knotenpunkte des BioMedIT Netzwerks jeweils einen Softwareentwickler in Vollzeit zur Verfügung stellen musste, waren zumindest ausreichend personelle Ressourcen vorhanden. Diese mussten nur noch richtig koordiniert werden. Mit der Einführung von Scrum wurde der agile Grundstein für die kontinuierliche Weiterentwicklung des gesamten Portals gelegt.
Agiles Release Management
Gerade bei kleineren Teams, die grosse Projekte zu bewältigen haben, eignet sich ein agiles Release Management. Mit der Umstellung auf agile Softwareentwicklung wurde die Versionierung der Releases neu in GitLab Repositories organisiert. Dadurch konnten sämtliche Änderungen protokolliert und sichergestellt werden, dass Arbeiten nicht verloren gehen oder versehentlich überschrieben werden. Am Code vorgenommene Änderungen konnten nicht nur überwacht, sondern bei Bedarf auch rückgängig gemacht werden. Die Hauptanwendungen sind heute als Open-Source Software in GitLab verfügbar.
Geplante Erweiterungen
Insbesondere für die Desktop-Applikation sett als zentrale Anwendung für den Transfer der Patientendaten in das Forschungsnetzwerk galten höchste Sicherheitsanforderungen. Zu ihrer Grundfunktionalität sollte neben asymmetrischer Verschlüsselung und Signierung auch eine leistungsstarke Datenkomprimierung gehören. Diese wird durch die grossen Datenmengen von mehreren 100 GB und mehr notwendig, die über die Anwendung hochgeladen werden sollten.
Um die Nutzung für alle Nutzer so einfach wie möglich zu machen, muss sett auf unterschiedlichen Betriebssystemen laufen. Zudem sollte neben einer grafischen Benutzeroberfläche für Datensender auch eine Befehlszeilenschnittstelle für Data Analysts angeboten werden.
Sicherheit neu gedacht
Nachdem die Anforderungen in der bisher verwendeten Programmiersprache Python nicht zur vollen Zufriedenheit umgesetzt werden konnten, wurde die bestehende Applikation sett neu in Rust umgesetzt. Diese Programmiersprache gilt als besonders sicher. Für die Verschlüsselung wurde Sequoia-PGP, eine ebenfalls auf Rust basierende OpenPGP-Implementierung, integriert. Durch diese Verschlüsselung können Spitalmitarbeitende sicher sein, dass niemand während dem Transfer auf die Patientendaten zugreifen kann. Zudem wurde für den Datentransfer mit S3 ein schnelleres, moderneres und standardisiertes Protokoll im Vergleich zum bisher genutzten SFTP eingeführt.
Weitere Reisehighlights
Das Team unter der Leitung von Karakun hat nicht nur die beiden Hauptanwendungen (weiter-) entwickelt. Vielmehr ist ein ganzes Ökosystem entstanden. Hierzu zählen:
- Zwei zusätzliche, auf BioMedIT Portal basierenden Applikationen
- System zur Überwachung auf Basis von Prometheus
- Visualisierung von Metriken auf der Grundlage von Grafana
- Alarmierung und Protokollsammlung auf der Grundlage von OpenSearch
Erfolgreiches Projekt mit grossem Nutzen für die Wissenschaft
Nach rund 4 Jahren kommen die Entwicklungen voraussichtlich 2024 zum Abschluss und die operative Phase beginnt. Auch dank all der technischen Neuerungen und Erweiterungen sind heute fast 1’000 Endanwender im BioMedIT Netzwerk registriert. Die Unispitäler transferieren jedes Jahr mehrere hundert Pakete über das System. Auch Katrin Crameri ist begeistert: «Wir haben es geschafft, praktikable und zielführende Lösungen für die Mobilisierung und Administration von sensitiven Daten in multizentrischen Forschungsdaten zur Verfügung zu stellen. Dies unter strenger Einhaltung der ethischen und rechtlichen Anforderungen im Bereich Datenschutz und Datensicherheit, über alle Funktionalitätsebenen hinweg. Die Unterstützung durch Karakun bei der Entwicklung der Tools und Prozesse wurde von allen Beteiligten im Netzwerk stets sehr geschätzt».
Wir freuen uns dazu beigetragen zu haben, dass in Zukunft Patient:innen in der Schweiz durch die Arbeit der Forschenden über das BioMedIT Netzwerk eine bessere und zielgerichtete Behandlung erhalten können.