CAU Logo
Christian–Albrechts–Universität zu Kiel
Institut für Medizinische Informatik und Statistik
Logo
english

Anforderungen an Daten / Datenstruktur

Für den Fall, dass durch Mitarbeiter des Institutes die Auswertung der Daten im Rahmen wissenschaftlicher Arbeiten (im Folgenden kurz Projekt) unterstützt werden soll, sind die folgenden grundlegenden Aspekte zu berücksichtigen:

1. Verantwortlichkeit

Die Erfassung der Daten erfolgt grundsätzlich durch den ‚Ratsuchenden' (Doktorand, Habilitand). Er ist für die Richtigkeit und Vollständigkeit der Daten, der dazu gehörenden Schlüssellisten (Codierungen) und die Richtigkeit der begleitenden Projektdokumentation verantwortlich.

2. Anonymisierung der Daten

Alle dem IMIS übergegebenen Daten müssen pseudonymisiert sein, d.h. die Daten enthalten keine der folgenden Angaben:
Klinik-Patientennummer, Fallnummer, Vorname, Nachname, Initialen, Geburtsname, Anschrift, Telefonnummer, Fax-Nummer, E-Mail-Adresse, Geburtstag, Geburtsmonat, Arbeitgeber, Krankenversicherung, sowie keine Daten, aus denen eine dieser Informationen ermittelt werden kann.

3. Erfassung

Die Erfassung der Daten erfolgt mit Hilfe eines Datenbankprogramms (z.B. ACCESS) oder über ein Statistikprogramm (z.B. SPSS), in dem eine vollständige Definition und Skalierung aller Daten möglich ist und welches eine Kontrolle der Datenerfassung ermöglicht. Für den Fall der Datenerfassung mit einem Tabellenprogramm (EXCEL) ist besonders auch Punkt 8 zu beachten!

4. Auswertung

Die Auswertung von Daten mit einem Statistikprogramm basiert auf einer Tabelle,


zum vergrößern anklicken!

in deren Zeilen die Fälle (Patienten, Probanden, Versuche, ...) und in deren Spalten Merkmale (Beobachtungen) eingetragen sind. In jeder Zeile wird nur ein Fall dokumentiert; die Anzahl der Zeilen entspricht der Anzahl der Fälle, die in einer Auswertung berücksichtigt werden (Definition). In jeder Spalte wird nur ein Merkmal (Befund) dokumentiert.

Zur Identifikation der Fälle ist eine Studien- oder Projektnummer als zusätzliches Merkmal aufzunehmen.

Verschiedene Gruppen oder Untergruppen (Patienten, Behandlungen) müssen durch ein zusätzliches Merkmal gekennzeichnet werden. Wiederholte Messungen/Untersuchungen an einem Fall müssen durch eine Wiederholung der entsprechenden Spalten in die Tabelle aufgenommen werden!

5. Merkmale

Jedes Merkmal wird durch einen Namen (8 Zeichen lang, erstes Zeichen Buchstabe, sonst Buchstaben oder Zahlen aber keine Umlaute und Sonderzeichen) und durch eine sinnvolle Kurzbezeichnung (30 Zeichen) beschrieben. In Abhängigkeit von der Messbarkeit (Skala) der Merkmale sind bei der Erfassung die folgenden Bedingungen zu berücksichtigen:

  • Kategorielle Merkmale werden grundsätzlich verschlüsselt erfasst. Wünschenswert ist dabei eine ‚numerische' Codierung (Zahlen 1, 2, ...). Eine vollständige Liste der verwendeten Schlüssel gehört zur begleitenden Dokumentation. Häufbare Merkmale (Diagnosen, Komplikationen, Risiken) müssen einzeln aufgegliedert (ja/nein) oder unter einem Schlüssel in verschiedenen Merkmalen (z.B. bis zu 3 Diagnosen) aufgenommen werden. Dichotome Merkmale sollten mit 0 und 1 im Sinne von nein/ja codiert werden.
  • Metrische Merkmale (Messwerte) werden durch Zahlen mit festem Format (Dezimal-stellen) erfasst. Die Beschreibung von Minimal- und Maximalwerten (Nachweis-grenzen), der Skalierung (Einheiten), sowie die Angabe von Normalwerten gehört zur begleitenden Dokumentation.
  • Hilfs-Merkmale (Hilfsgrößen), z.B. Datums- oder Zeitangaben, dienen der Berechnung von Merkmalen (Alter, Verweildauer, ...) und werden bei der Auswertung nur indirekt verwendet. Die entsprechenden Berechnungen sollten im Datenbank-programm oder Statistikprogramm bereits durchgeführt und dokumentiert (Formeln) sein.

6. Abhängigkeiten

Abhängigkeiten zwischen verschiedenen Merkmalen bzw. Formeln zur Ableitung/ Berechnung neuer Merkmale sind in der begleitenden Dokumentation festzuhalten.

7. Fehlende Angaben

Fehlende Angaben können speziell codiert werden (‚999') oder die entsprechenden Einträge werden ‚leer' gelassen. Nicht zutreffende Angaben müssen erkennbar gegen fehlende Angaben durch zusätzliche Merkmale oder Codierungen abgegrenzt werden.

8. Erfassung mit EXCEL

Die Erfassung der Daten kann ‚notfalls' auch mit einem Tabellenkalkulationsprogramm (EXCEL) erfolgen. Die Zahl der Fälle sowie die Zahl der Merkmale sollte allerdings ‚überschaubar' sein. Mit dem ‚Fixieren' einiger Zeilen und Spalten, in denen die wesentlichen Angaben zu den Fällen und Merkmalen verzeichnet sind, ist eine Orientierung innerhalb der Tabelle möglich. Zusätzlich zu den oben genannten Aspekten ist Folgendes zu beachten:

  • Die Benennung der Merkmale erfolgt grundsätzlich in der ersten Zeile. Da keine weiteren Erklärungen (Kurzbezeichnungen) möglich sind, sollte der Name hier besonders ‚aussagefähig' gewählt werden. Erläuterungen können als Notiz zu der Zelle angehängt oder in einer begleitenden Dokumentation zusammengefasst werden.

  • Die Spalten der Tabelle dürfen nicht durch das ‚Standard'-Format gekennzeichnet werden. Hierunter verbergen sich beliebige Einträge, die bei der Auswertung zu gravierenden Problemen führen. Jede Spalte muss entsprechend der Ausführungen unter Punkt 3 vor der Datenerfassung durch ein geeignetes Format beschrieben werden.

  • In den Tabellenfeldern befinden sich ausschließlich ‚Werte', auf keinen Fall jedoch Formeln oder Verknüpfungen