Springe zum Inhalt

Seite 14: Validierung von Sekundärdaten – Grenzen und Möglichkeiten

Bibl. Angaben: Hoffmann, F.; Andersohn, F.; Giersiepen, K.; Scharnetzky, E.; Garbe, E. (2008a): Validierung von Sekundärdaten. Grenzen und Möglichkeiten. In: Bundesgesundheitsblatt, Gesundheitsforschung, Gesundheitsschutz 51 (10), S. 1118–1126. DOI: 10.1007/s00103-008-0646-y.

Zusammenfassung: Arztbasierte Datenbanken (wie die General Practice Research Database, GPRD) und administrative Datenbanken [wie Daten aus der Gesetzlichen Krankenversicherung (GKV) in Deutschland] sind nützliche Quellen für die Pharmakoepidemiologie und Versorgungsforschung. Es muss allerdings berücksichtigt werden, dass diese Daten nicht primär für Forschungszwecke generiert werden. Deshalb sind Validierungsstudien erforderlich, um die Güte und Vollständigkeit der Daten in Abhängigkeit von der Forschungsfrage beurteilen zu können.

Der Artikel stellt Möglichkeiten vor, wie interne Konsistenzprüfungen und/oder eine interne Validierung von GKV-Daten anhand der Daten einer einzelnen Krankenkasse oder unter Berücksichtigung der Daten mehrerer Krankenkassen durchzuführen sind. Interne Konsistenzprüfungen dienen dazu, mögliche Unstimmigkeiten in den Daten zu erkennen. Bei der internen Validierung sollen sichere von unsicheren Fällen anhand der vorliegenden Sekundärdaten separiert bzw. bekannte Zusammenhänge innerhalb der Datenbank reproduziert werden. Erstrebenswert ist zusätzlich eine externe Validierung von Sekundärdaten, die unter Rückgriff auf Rezeptdaten, Patientenakten, Krankenhausentlassungsbriefe oder Patienten- bzw. Arztbefragungen als Goldstandard durchgeführt werden kann. Während insbesondere für die GPRD umfangreiche externe Validierungsstudien vorliegen, sind derartige Untersuchungen für deutsche GKV-Daten erst in Ansätzen vorhanden, aber dringend erforderlich.

Einordnung in den Kontext des Pandemiemanagements: Dieser Artikel ergänzt den Artikel von Schubert et al. (2010) um Aspekte der externen Validierung unter Zuhilfenahme weitere Datenquellen. Für das Pandemiemanagement bedeutet dies die Möglichkeit der Nutzung verschiedener Datenquellen in Erwägung zu ziehen.