Big Data & Medizin
Big Data kann Unglaubliches leisten — birgt aber auch Gefahren. Besonders deutlich wird das bei persönlichen Daten, allen voran medizinischen Befunden. Big Data Analysis arbeitet ausschließlich mit anonymisierten Daten. Konkret heißt das, aus den Daten kann nicht auf die Person zurück geschlossen werden von der die Daten stammen.
Interpolation von Laborwerten von Krebspatienten
Am Institut für medizinische Statistik (CeMSIIS) stehen uns für 418 verschiedene Blut- und Harnparameter fast 6 Millionen Laborwerte von über 2000 Krebspatienten zur Verfügung. Trotz dieses Umfangs ist dieser Datensatz dennoch lückenhaft, mit Messfehlern versehen und auch zeitlich nicht homogen, d.h. die Messungen werden teilweise zu verschiedenen Zeitpunkten vorgenommen.
Big Data liefert Strategien wie mit fehlenden und inkorrekten Daten richtig vorzugehen ist. In der Fachsprache nennt man das "Interpolation von Daten". Ein besonderes Anliegen ist es dabei sicherzustellen dass die Ergebnisse nur für medizinische Zwecke verwendet werden können und kein potentieller Nachteil für Patienten entstehen kann.