| Hogrefe Testsystem 4 |
![]() |
||||||
|
d2-C Ÿ Aufmerksamkeits-Belastungs-Test (32BIT)
Übersicht
Das Verfahren
Vor dem Hintergrund eines immer stärkeren Einsatzes von Computern in der Psychodiagnostik und Rehabilitation, und dabei insbesondere in der Aufmerksamkeitsdiagnostik und -therapie (vgl. z.B. Säring 1988; Prosiegel 1991; Sturm, Hartje, Orgaß & Willmes 1994), ist eine Adaptation des d2 unter Nutzung der speziellen Möglichkeiten des Computers vorgenommen worden, die durch eine möglichst ansprechende Gestaltung die Testmotivation unterstützen soll und sowohl im Gesunden- als auch im Patientenbereich einsetzbar sein sollte (Merten & Hänsgen 1994; Merten 1995).
Beschreibung der Skalen bzw. Merkmale
Testaufbau: Verwendet wurden 10 verschiedene Zeichen, die Kombinationen von Buchstaben (d und p) und Punkten (1 bis 4) ober- und/oder unterhalb der Buchstaben darstellen. Je neun Zeichen werden pro Bildschirm dargeboten (Abbildung d2-C.1). Jedem Zeichen ist eine Ziffer zugeordnet. Die Aufgabe des Probanden besteht darin, alle Items, die ein d mit genau zwei Punkten darstellen, zu markieren. Korrekturen sind zugelassen (erneutes Drücken der entsprechenden Zifferntaste). Die Bearbeitung soll entsprechend Instruktion immer von links nach rechts erfolgen. Nach "Abarbeitung" eines Bildschirms à 9 Zeichen kann der nächste Bildschirm aufgerufen werden.
Innerhalb des Tests werden insgesamt 12 Serien dargeboten. Jede Serie beginnt mit einem neuen Bildschirm (9 Zeichen); innerhalb der Bearbeitungszeit sollen mehrere Bildschirme einer Serie bearbeitet werden. Die Bearbeitungszeit pro Serie wurde mit 30 Sekunden effektiver Bearbeitungszeit festgelegt (rechnerabhängig kommen noch ca. 3 Sekunden Bildumschaltzeiten hinzu). Eine Serie ist mit dem ersten Tastendruck nach Ablauf der Bearbeitungszeit beendet. Die Durchführungszeit einschließlich Instruktion und Übung beträgt ca. 10 Minuten.
Aufbau der Serien: Pro Bildschirm sind unter den neun Zeichen zwei bis fünf Zielzeichen (d mit 2 Punkten). Die Anzahl der jeweils vorhandenen Zielzeichen wurde innerhalb der Serien mit folgenden Restriktionen randomisiert:
- der erste bis vierte Bildschirm jeder Serie enthalten drei bis fünf Zielzeichen, die Summe der insgesamt auftretenden Zielzeichen beträgt 16 (von insgesamt 4 x 9 = 36 Zeichen);
- der fünfte und sechste Bildschirm enthalten je einmal zwei und vier, die siebte Bildschirmseite stets fünf Zielzeichen; die Summe der insgesamt auftretenden Zielzeichen beträgt also 11 (von insgesamt 3 x 9 = 27 Zeichen);
- für den achten bis elften und zwölften bis vierzehnten Bildschirm wurden erneut die oben ausgeführten Konstruktionsprinzipien angewandt.
Innerhalb der Zeichenanordnung auf einem Bildschirm wurde unter diesen Restriktionen die Reihenfolge der dargebotenen Zeichen (Ziel- und Distraktorzeichen) randomisiert.
Instruktion und Übung erfolgen interaktiv über den Bildschirm. Die Übungsserie enthält die Zielzeichen ebenfalls in zufälliger Reihenfolge. Drei aufeinander folgende Bildschirme der Übungsserie müssen korrekt bearbeitet sein, bevor Serie 1 des Tests startet. Insbesondere für den Einsatz bei schwerer beeinträchtigten Patientengruppen empfiehlt sich jedoch immer die mündliche Instruktionsdarbietung durch den Untersucher, da sonst - bei allem Bemühen um eine Standardisierung in der Psychodiagnostik - ein Instruktionsverständnis kaum gewährleistet werden kann.
Bemerkungen: Der Einsatz eines solchen Verfahrens erscheint grundsätzlich auch mit schwerer gestörten Patientengruppen möglich. Die Durchführung soll grundsätzlich nur in Anwesenheit des Untersuchers erfolgen, der insbesondere die Regelerlernung kontrollieren, sie notwendigenfalls unterstützen und gegebenenfalls auf die Testmotivation Einfluss nehmen muss. Eine Interpretation der Ergebnisse ist nur im Zusammenhang mit der Verhaltensbeobachtung möglich (evtl. eingelegte Pausen, Bewertung der Testmotivation, Bedienung des Computers während der gesamten Testzeit gewährleistet).
Alle hier vorgestellten Daten wurden im Einzelversuch unter Anwesenheit eines Untersuchers gewonnen, zum Einsatz kamen stets Standardbildschirm (14-Zoll-Farbmonitor) und -tastatur; die Normierungsdaten sind nur auf diese Bedingungen anwendbar. Die Daten der Gesunden wurden von 12 verschiedenen Versuchsleitern erhoben, die instruiert waren, die Testmotivation der Probanden zu maximieren. Die Durchführung des d2-C erfolgte in allen Gruppen nach einer Belastungsphase von mindestens 30 Minuten, während der andere Tests durchgeführt wurden. Selbst Probanden ohne Computerkenntnis hatten bei Testbeginn eine Mindesterfahrung mit der Eingabetastatur durch die Bearbeitung anderer Tests erworben.
Bei der Interpretation niedriger Leistungen bei hirnorganisch Erkrankten sollten die Hinweise beachtet werden, die im Abschnitt "Validität" gegeben werden.
Populationsbezogen normiert; mit Items verknüpft Populationsbezogen normiert; errechnet abgeleiteter/errechneter Wert (x) Behandlung fehlender Werte:
(0) sie werden ignoriert
(1) Regression zur Antwortschätzung verwendet
(2) mittlere Antwortstufe wird verwendet
(3) definierte Punktzahl wird verwendet
Merkmale Maus Tastatur Touchscreen GZ Gesamtzahl der bearbeiteten Zeichen ![]()
![]()
![]()
GZ-F Fehlerkorrigierte Gesamtleistung ![]()
![]()
![]()
F% Fehlerprozentwert ![]()
![]()
![]()
SB Schwankungsbreite ![]()
![]()
![]()
F Fehlermenge Gesamt (F1+F2) ![]()
![]()
![]()
F1 Auslassungen ![]()
![]()
![]()
F2 Verwechslung ![]()
![]()
![]()
F2B Verwechslung bei Buchstaben ![]()
![]()
![]()
F2S Verwechslung bei Strich ![]()
![]()
![]()
In Anlehnung an die Papier-und-Bleistift-Form werden im folgenden die aufgeführten Messwerte betrachtet (vgl. Brickenkamp 1994, S. 20-22); die mit Klammerausdrücken angegebenen Parameter erscheinen im Auswerteausdruck.
GZ Gesamtzahl der bearbeiteten Zeichen (1) über alle 12 Serien, also die nicht um die Fehlerzahl korrigierte Gesamtleistungsmenge. Normwerte (C-Normen) sind für zwei Altersgruppen der Gesunden- und drei Altersgruppen der Patientenstichprobe angegeben.F Fehlerrohwert (2), der sich aus zwei Fehlermöglichkeiten zusammensetzt: F1 sind die Auslassungsfehler und F2 die auch bei die Computerversion seltener auftretenden Verwechslungsfehler. Für die Verwechslungsfehler wird zusätzlich angegeben, ob es sich beim fälschlich erkannten Zeichen um eine Buchstabenvertauschung (p statt d) bei richtig identifizierten zwei Punkten oder um eine Fehlidentifizierung der Punktezahl (d mit mehr oder weniger als 2 Punkten) handelt.
F% Fehlerprozentwert (3), der den Fehlerrohwert (F) in Beziehung zur Gesamtzahl bearbeiteter Zeichen (GZ) setzt und ein besseres Genauigkeitsmaß als der Fehlerrohwert ist. Dieser Wert fällt für die Computerversion niedriger aus; er ist auf zwei Dezimalstellen genau angegeben; entsprechende Normwerte (Prozentränge) werden ausgegeben.
GZ-F Fehlerkorrigierte Gesamtleistung (4). Dieser Wert, ist, ebenso wie GZ und der Fehlerprozentwert, normiert (C-Normen).
SB Die Schwankungsbreite (5) ist die maximale Differenz zwischen den GZ-Werten in den einzelnen Serien.
Aufgrund der in jüngster Zeit geführten Kontroverse um fehlerkorrigierte Leistungswerte (vgl. Brickenkamp 1991, 1993; Oehlschlägel & Moosbrugger 1991, 1993) wurden, wenn auch bislang nicht für den Auswerteausdruck, bei den Analysen die beiden folgenden Testwerte berücksichtigt:
GZ-2F Im Gegensatz zu GZ-F wird bei diesem Wert die doppelte Fehleranzahl als Korrektur für die Gesamtleistung eingeführt.
KL Der Konzentrationsleistungswert wird aus der Menge der richtig erkannten Zielzeichen (d2) abzüglich der Verwechslungsfehler (F2) gebildet.
Wie unsere Analysen zur Computerversion jedoch zeigen, korrelieren die fehlerkorrigierten Maße GZ-F, GZ-2F und KL so hoch miteinander, dass auf eine gesonderte Ausgabe und Normierung der beiden letzteren verzichtet werden kann. Selten auftretende Einzelfälle instruktionswidrigen Verhaltens werden durch den anwesenden Untersucher ohnehin identifiziert und fallen überdies durch einen unangemessen hohen F%-Wert auf.
Der Auswerteausdruck liefert zusätzlich zu den genannten Parametern auch eine numerische und graphische Verlaufsanalyse der GZ-F- und F1-/F2-Werte über die 12 Serien hinweg.
Normierung
Für die Durchführung der Computerversion des d2 stehen drei verschiedene Eingabemedien zur Verfügung: Maus, Tastatur und Touchscreen. Die Aufgabenstellung ist in diesen drei Testformen identisch; es ist jedoch aufgrund der hohen Abhängigkeit der Ergebnisse von der Bearbeitungsgeschwindigkeit mit systematischen Einflüssen der Eingabemedien zu rechnen. Eine direkte Untersuchung dieser Einflüsse ist nicht möglich, da bislang keine Vergleichsdaten von Personen vorliegen, die den Test mehrfach mit unterschiedlichen Eingabemedien bearbeitet haben. Die folgende Tabelle liefert hierzu jedoch erste Anhaltspunkte, da die Ergebnisse vergleichbarer Stichproben (hinsichtlich Alter und Fragestellung) gegenübergestellt werden. Für jeweils k zusammengefasste Stichproben wird die Spanne der Mittelwerte und Standardabweichungen berichtet. Es zeigt sich, dass erwachsene Bewerber in der Mausversion durchgängig mehr Zeichen bearbeiten als in der Tastaturversion. Darüber hinaus bearbeiten Kinder und Jugendliche in der Touchscreenversion tendenziell mehr Zeichen als in der Mausversion. Für die Fehlerhäufigkeit und die Schwankungsbreite sind keine eindeutigen Trends beobachtbar. Die zusätzliche sensumotorische Koordinationsaufgabe der Mausversion führt im Vergleich zur Touchscreenversion somit nicht zu einem höheren Fehleranteil, sondern nur zu einer tendenziell geringeren Leistungsmenge. Insgesamt verweisen diese Befunde auf die Notwenigkeit spezifischer Normen für die drei Eingabemedien.
Die zur Verfügung stehenden Normgruppen der drei Testversionen werden im Folgenden ausführlich beschrieben. Die dargestellten Normierungsdaten zur Tastatur- und zur Touchscreenversion enthalten zudem einige Befunde zur Parallelität der jeweiligen Version mit der Papier-Durchführung des d2.
Maus Tastatur Touchscreen
k Mittelwert Standardabw. k Mittelwert Standardabw. k Mittelwert Standardabw. Erwachsene Bewerber
GZ Leistungsmenge gesamt 4 472 - 564 69 - 78 1 387 80 - - - GZ-F Leistungsmenge richtiger Reaktionen 4 464 - 557 69 - 78 1 381 79 - - - F% Fehlerprozent 4 1.3 - 1.9 1.1 - 3.3 1 1.6 1.3 - - - SB Schwankungsbreite 4 13.1 - 13.4 4.4 1 13.1 4.6 - - - Kinder und Jugendliche (Patienten), 9-17 Jahre
GZ Leistungsmenge gesamt 4 281 - 420 60 - 89 - - - 9 302 - 498 83 GZ-F Leistungsmenge richtiger Reaktionen 4 270 - 410 59 - 89 - - - 9 292 - 485 83 F% Fehlerprozent 4 2.4 - 4.0 1.9 - 3.9 - - - 1 3.0 1.9 SB Schwankungsbreite 4 12.8 - 15.0 4.8 - 5.2 - - - 1 14.3 3.9
Unter der folgenden Übersichtstabelle finden sich die Beschreibungen der einzelnen Normstichproben und ihre Testkennwerte nach Eingabemedium sortiert.
Norm Maus Tastatur Touchscreen Lehrlingsauswahl Deutschland
Altersklassen Geschlechts- und Eingabemedium-unspezifisch von 17J bis 26;11J N = 1187 - 1188 Lehrlingsauswahl Deutschland, Gymnasiasten
Altersklassen Geschlechts- und Eingabemedium-unspezifisch von 18J bis 26;11J N = 553 Lehrlingsauswahl Deutschland, Nicht-Gymnasiasten
Altersklassen Geschlechts- und Eingabemedium-unspezifisch von 17J bis 26;11J N = 635 Lehrlingsauswahl Schweiz
Altersklassen Geschlechts- und Eingabemedium-unspezifisch von 15J bis 30;11J N = 905 8. Klasse
Altersklassen Geschlechts- und Eingabemedium-unspezifisch von 13J bis 17;11J N = 480 9./10. Klasse
Altersklassen Geschlechts- und Eingabemedium-unspezifisch von 15J bis 17;11J N = 954 Erwachsene, berufliche Neuorientierung; gesamt
Altersklassen Geschlechts- und Eingabemedium-unspezifisch von 17J bis 61;11J N = 835 Erwachsene, berufliche Neuorientierung; altersspezifisch
Altersklassen Geschlechts- und Eingabemedium-unspezifisch von 17J bis 32;11J N = 287 von 33J bis 42;11J N = 273 von 43J bis 61;11J N = 275 Erwachsene, berufliche Neuorientierung; Abitur
Altersklassen Geschlechts- und Eingabemedium-unspezifisch von 22J bis 61;11J N = 118 Erwachsene, berufliche Neuorientierung; Mittlere Reife
Altersklassen Geschlechts- und Eingabemedium-unspezifisch von 18J bis 58;11J N = 405 Erwachsene, berufliche Neuorientierung; Hauptschulabschluss
Altersklassen Geschlechts- und Eingabemedium-unspezifisch von 18J bis 59;11J N = 167 Rehabilitanden BFW (2007) - Zweitmessung, gesamt
Altersklassen Geschlechts- und Eingabemedium-unspezifisch von 17J bis 57;11J N = 527 Rehabilitanden BFW (2007) - Zweitmessung, altersspezifisch
Altersklassen Geschlechts- und Eingabemedium-unspezifisch von 17J bis 35;11J N = 291 von 36J bis 57;11J N = 236 Teilnehmer berufsvorbereitender Lehrgänge, gesamt
Altersklassen Geschlechts- und Eingabemedium-unspezifisch von 16J bis 25;11J N = 210 Teilnehmer berufsvorbereitender Lehrgänge, altersspezifisch
Altersklassen Geschlechts- und Eingabemedium-unspezifisch von 16J bis 18;11J N = 110 von 19J bis 25;11J N = 100 Kinder und Jugendliche mit Lern-/Verhaltensauffälligkeit
Altersklassen Geschlechts- und Eingabemedium-unspezifisch von 9J bis 10;11J N = 246 von 11J bis 12;11J N = 242 von 13J bis 14;11J N = 135 von 15J bis 17;11J N = 146 Kinder mit hyperkinetischer Störung (F90, Verdachtsdiagnose)
Altersklassen Geschlechts- und Eingabemedium-unspezifisch von 9J bis 12;11J N = 146 Gesunde, altersspezifisch
Altersklassen Geschlechts- und Eingabemedium-unspezifisch von 18J bis 40;11J N = 264 von 41J bis 60;11J N = 59 Patienten, altersspezifisch
Altersklassen Geschlechts- und Eingabemedium-unspezifisch von 15J bis 40;11J N = 83 von 41J bis 60;11J N = 94 von 61J bis 81;11J N = 39 Bewerber mittelständisches, produzierendes Unternehmen
Altersklassen Geschlechts- und Eingabemedium-unspezifisch von 16J bis 54;11J N = 246 Neurologische Rehabilitationspatienten, gesamt
Altersklassen Geschlechts- und Eingabemedium-unspezifisch von 17J bis 65;11J N = 265 Neurologische Rehabilitationspatienten, altersspezifisch
Altersklassen Geschlechts- und Eingabemedium-unspezifisch von 17J bis 41;11J N = 95 von 42J bis 51;11J N = 91 von 52J bis 65;11J N = 79 Kinder und Jugendliche (Patienten), altersspezifisch
Altersklassen Geschlechts- und Eingabemedium-unspezifisch von 9J bis 9;11J N = 193 von 10J bis 10;11J N = 193 von 11J bis 11;11J N = 193 von 12J bis 12;11J N = 193 von 13J bis 13;11J N = 193 von 14J bis 14;11J N = 193 von 15J bis 15;11J N = 193 von 16J bis 16;11J N = 193 von 17J bis 17;11J N = 193 Kinder und Jugendliche (Patienten), alters- und geschlechtsspezifisch
Altersklassen Frauen Männer Eingabemedium unspezifisch Eingabemedium unspezifisch von 9J bis 9;11J N = 92 N = 101 von 10J bis 10;11J N = 92 N = 101 von 11J bis 11;11J N = 92 N = 101 von 12J bis 12;11J N = 92 N = 101 von 13J bis 13;11J N = 92 N = 101 von 14J bis 14;11J N = 92 N = 101 von 15J bis 15;11J N = 92 N = 101 von 16J bis 16;11J N = 92 N = 101 von 17J bis 17;11J N = 92 N = 101 Archiv: Kinder- und Jugendpsychiatrie-Patienten, gesamt
Altersklassen Geschlechts- und Eingabemedium-unspezifisch von 9J bis 17;11J N = 252 Archiv: Kinder- und Jugendpsychiatrie-Patienten, altersspezifisch
Altersklassen Geschlechts- und Eingabemedium-unspezifisch von 9J bis 10;11J N = 79 von 11J bis 13;11J N = 96 von 14J bis 17;11J N = 77 Archiv: Rehabilitanden BFW, gesamt (2007)
Altersklassen Geschlechts- und Eingabemedium-unspezifisch von 17J bis 58;11J N = 570 Archiv: Rehabilitanden BFW, altersspezifisch (2007)
Altersklassen Geschlechts- und Eingabemedium-unspezifisch von 17J bis 35;11J N = 302 von 36J bis 58;11J N = 268 Archiv: Rehabilitanden BFW, gesamt (2003)
Altersklassen Geschlechts- und Eingabemedium-unspezifisch von 17J bis 58;11J N = 835 Archiv: Rehabilitanden BFW, altersspezifisch (2003)
Altersklassen Geschlechts- und Eingabemedium-unspezifisch von 17J bis 31;11J N = 296 von 32J bis 38;11J N = 294 von 39J bis 58;11J N = 245 Archiv: Rehabilitanden BFW Leipzig, gesamt (2001)
Altersklassen Geschlechts- und Eingabemedium-unspezifisch von 21J bis 58;11J N = 261 Archiv: Rehabilitanden BFW Leipzig, altersspezifisch (2001)
Altersklassen Geschlechts- und Eingabemedium-unspezifisch von 21J bis 35;11J N = 145 von 36J bis 58;11J N = 116 Archiv: Rehabilitanden BFW Birkenfeld, gesamt (2001)
Altersklassen Geschlechts- und Eingabemedium-unspezifisch von 17J bis 53;11J N = 549 Archiv: Rehabilitanden BFW Birkenfeld, altersspezifisch (2001)
Altersklassen Geschlechts- und Eingabemedium-unspezifisch von 17J bis 30;11J N = 169 von 31J bis 35;11J N = 127 von 36J bis 40;11J N = 146 von 41J bis 53;11J N = 107
Normierung der Mausversion
Für die Mausversion liegen Normen vor für die Lehrlingsauswahl Deutschland, die Lehrlingsauswahl Schweiz, für Schülerinnen und Schüler der 8. sowie 9./10. Klasse, für Erwachsene in der beruflichen Neuorientierung, für die Zweitmessung von Rehabilitanden (Testintervall: 5 Stunden), für Teilnehmer berufsvorbereitender Lehrgänge und für Kinder- und Jugendliche mit Lern-/Verhaltensauffälligkeiten.
1. Lehrlingsauswahl Deutschland
Datenquelle: Merck KGaA, Darmstadt; Fr. Heese; 2000
Stichprobenbeschreibung:
N Geschlecht Alter in Jahren männlich weiblich Min. Max. Mittelwert Gesamtstichprobe (Ges.) 1188 608 (51%) 580 (49%) 17 26 19.6 Bildungsspezifische Stichproben Gymnasiasten (Gym.) 553 206 (37%) 347 (63%) 18 26 21.2 Nicht-Gymnasiasten (N-Gym.) 635 402 (63%) 233 (37%) 17 26 18.3 Testwerteverteilung der Gesamtstichprobe und der bildungsspezifischen Normgruppen:
Minimum Maximum Mittelwert Standardabweichung Ges. Gym. N-Gym. Ges. Gym. N-Gym. Ges. Gym. N-Gym. Ges. Gym. N-Gym. GZ Leistungsmenge gesamt 275 361 275 813 813 742 532 564 505 78 76 69 GZ-F Leistungsmenge richtiger Reaktionen 269 348 269 805 805 732 524 557 495 78 75 69 F% Fehlerprozent 0.0 0.0 0.0 9.5 7.5 9.5 1.6 1.3 1.9 1.4 1.1 1.5 SB Schwankungsbreite 4 4 4 45 45 31 13.3 13.2 13.4 4.4 4.4 4.4
2. Lehrlingsauswahl Schweiz
Datenquelle: Novartis AG, Basel; Hr. Jürg Tassera; 2002
Stichprobenbeschreibung:
Positionen: Laboranten Biologie, Laboranten Chemie, Kaufmännische Berufe, Informatik und Elektronik.
N Geschlecht Alter in Jahren männlich weiblich Minimum Maximum Mittelwert Gesamtstichprobe 905 660 (73%) 245 (27%) 15 30 17.9 Testwerteverteilung:
Min. Max. Mittelwert Standardabw. GZ Leistungsmenge gesamt 99 752 472 72 GZ-F Leistungsmenge richtiger Reaktionen 46 747 464 73 F% Fehlerprozent 0.00 53.54 1.76 3.27 SB Schwankungsbreite 4 36 13.1 4.4
3. Schülerinnen und Schüler der 8. Klasse (Hauptschule)
Datenquelle: Internationaler Bund, Köln; Hr. Dipl.-Psych. Bernhard Meyer; 2006-2007
Stichprobenbeschreibung:
Bei den Schüler/innen dieser Stichprobe handelte es sich um Teilnehmer/innen an Potenzialanalysen im Rahmen des EQUAL-Teilprojektes "KomPass" (KompetenzAssessment). Diese eintägigen Kompetenzfeststellungsverfahren wurden 2005 bis 2007 beim Internationalen Bund in Köln durchgeführt und beinhalteten systematische Verhaltensbeobachtungen (angelehnt an den Ansatz des Assessment-Centers) sowie standardisierte Testverfahren in Computer- und Papierform.
Zielgruppe waren einerseits 8.-Klässler, bei denen mit einer normalen Schullaufbahn einschließlich Abschluss zu rechnen ist. Andererseits nahmen auch Schüler/innen ab dem 8. Schulbesuchsjahr teil, die voraussichtlich die Schule nach Erfüllung der Vollzeitschulpflicht (nach 10 Jahren) ohne Abschluss verlassen werden (so genannte "Frühabgänger"). Die Probanden dieser Stichprobe hatten somit in überdurchschnittlichem Maß Probleme im Übergang Schule-Beruf, weshalb ein bedeutender Teil von ihnen an besonderen schulischen Übergangsmanagementprojekten teilnahm ("BuS"(Betrieb und Schule)-Klassen, ProSekko, Wegeplanung).
N Geschlecht Alter in Jahren männlich weiblich Min. Max. Mittelwert Standardabw. Gesamtstichprobe
480 274 (57%) 206 (43%) 13 17 14.9 0.9 Testwerteverteilung:
Min. Max. Mittelwert Standardabw. GZ Leistungsmenge gesamt 187 642 397.3 73.8 GZ-F Leistungsmenge richtiger Reaktionen 172 631 381.6 71.0 F% Fehlerprozent 0.00 26.81 3.91 3.29 SB Schwankungsbreite 4 150 16.4 12.0
4. Schülerinnen und Schüler der 9./10. Klasse
Datenquelle: Internationaler Bund, Köln; Hr. Dipl.-Psych. Bernhard Meyer; 2005-2006
Stichprobenbeschreibung:
Im Auftrag der Landesregierung Nordrhein-Westfalen und der Industrie- und Handelskammer (IHK) bietet der Internationale Bund in Köln Schülerinnen und Schülern der Region, die vor bzw. am Beginn ihres letzten Pflichtschuljahr stehen, die Teilnahme an einem zweitägigen "Kompetenzcheck" an. Anhand verschiedener diagnostischer Verfahren werden die Schüler hinsichtlich ihrer beruflich relevanten Stärken und Schwächen getestet und beraten.
Im Herbst 2005 haben ca. 400 Schüler zu Beginn der 10. Klasse von 12 Hauptschulen, 1 Gesamtschule und 1 Realschule teilgenommen. Im Frühjahr 2006 wurden weitere ca. 600 Schüler am Ende der 9. Klasse getestet, die von 11 Hauptschulen, 1 Realschule und 1 Förderschule stammten, wo sie mehrheitlich jeweils den Abschluss nach der Klasse 10 anstrebten.
N Geschlecht Alter in Jahren männlich weiblich Min. Max. Mittelwert Standardabw. Gesamtstichprobe 954 483 (51%) 471 (49%) 15 17 15.7 0.7 Testwerteverteilung:
Min. Max. Mittelwert Standardabw. GZ Leistungsmenge Gesamt 171 688 425 71 GZ-F Leistungsmenge richtiger Reaktionen 143 680 411 70 F% Fehlerprozent 0.00 37.57 3.32 2.97 SB Schwankungsbreite 4 124 16 8
5. Erwachsene, berufliche Neuorientierung
Datenquellen:
- Berufsförderungswerk (BFW) Leipzig; Dipl.-Psych. Kathrin Bemmann; 2007; N = 567
- gpe Gesellschaft für Personalentwicklung mbH, Frankfurt am Main; Hr. Dipl.-Soz. Henry Urmann; 2007-2008; N = 268Stichprobenbeschreibung:
Die Stichproben der o. g. Institutionen haben sich hinsichtlich der Testkennwerte als homogen erwiesen und wurden daher zusammengefasst, um ausgehend von einer größeren Gesamtstichprobe differenzierte Teilgruppennormen entwickeln zu können.
Die Teilnehmer der beiden Stichproben, die im Folgenden näher beschrieben werden, haben den Test jeweils in einem Beratungskontext zur beruflichen Neuorientierung bearbeitet. Im Hinblick auf den höchsten erreichten Schulabschluss setzt sich die Gesamtstichprobe wie folgt zusammen: 14% Abitur, 49% mittlere Reife, 20% Hauptschulabschluss, 8% ohne Schulabschluss sowie 9% ohne Angaben.BFW Leipzig:
Die erwachsenen Rehabilitanden haben den d2-C im Rahmen der Berufsfindung und Arbeitserprobung bearbeitet. Die Durchführung erfolgte als Gruppentestung, in der Regel mit 14 bis 18 Personen.
Die häufigsten Behinderungsarten dieser Stichprobe sind Krankheiten des Muskel- und Skelettsystems (ca. 40%), Verletzungen, Vergiftungen und bestimmte andere Folgen äußerer Ursachen (ca. 15%), psychische und Verhaltensstörungen (ca. 8%), Krankheiten der Haut (ca. 8%) und Krankheiten des Kreislaufsystems (ca. 6%).gpe:
Die gpe führt in Hessen und Nordrhein-Westfalen im Auftrag der Arbeitsverwaltung (Arbeitsagenturen, ARGEn, Optionskommunen) verschiedene Dienstleistungen zur Arbeitsvermittlung durch. Bei den Arbeitssuchenden handelt es sich um kurz- und längerfristig Arbeitslose sowie zu einem geringeren Anteil um Jugendliche (16-25 Jahre) bei der Suche nach einem Ausbildungsplatz.
Die Testbearbeitung erfolgt als Einzeltestung im Kontext von Berufsberatung, Bewerber-Profiling und zur Ermittlung von Arbeitsmarktchancen. Im Vordergrund steht die Vermittlung der Teilnehmer an potenzielle Arbeitgeber, wobei auch Rehabilitationsfragen nach Unfällen und Integrationsmaßnahmen von Immigranten eine Rolle spielen. Die Testmotivation der Teilnehmer ist in der Regel gut ausgeprägt, da die individuelle Beratung durch gpe als Chance gesehen wird, eigene Fähigkeiten und Möglichkeiten von unabhängiger Seite kennen zu lernen.
N Geschlecht Alter in Jahren männlich weiblich Min. Max. Mittelwert Standardabw. Gesamtstichprobe 835 519 (62%) 316 (38%) 17 61 37.7 10.5 Altersspezifische Stichproben
Altersgruppe 17-32 Jahre (1) 287 175 (61%) 112 (39%) 17 32 26.0 3.7 Altersgruppe 33-42 Jahre (2) 273 181 (66%) 92 (34%) 33 42 37.6 2.6 Altersgruppe 43-61 Jahre (2) 275 163 (59%) 112 (41%) 43 61 50.0 4.7 Bildungsspezifische Stichproben
Abitur (A) 118 59 (50%) 59 (50%) 22 61 41.4 10.4 Mittlere Reife (MR) 405 265 (65%) 140 (35%) 18 58 37.4 9.2 Hauptschulabschluss (HS) 167 106 (63%) 61 (37%) 18 59 40.2 12.2 Testwerteverteilung der Gesamtstichprobe, der Altersgruppen 1 - 3 und der bildungsspezifischen Stichproben:
Minimum Maximum Mittelwert Standardabw. Gesamtstichprobe
GZ Leistungsmenge gesamt 99 655 400.8 96.3 GZ-F Leistungsmenge richtiger Reaktionen 98 651 393.3 95.7 F% Fehlerprozent 0.00 9.01 1.95 1.62 SB Schwankungsbreite 2 36 16.0 5.4 Altersspezifische Stichproben
1 2 3 1 2 3 1 2 3 1 2 3 GZ Leistungsmenge gesamt 202 99 110 655 644 643 432.3 400.3 368.4 86.4 94.3 97.6 GZ-F Leistungsmenge richtiger Reaktionen 200 98 107 651 641 624 425.0 392.9 360.6 85.9 93.7 96.7 F% Fehlerprozent 0.00 0.00 0.00 8.63 9.01 8.97 1.72 1.90 2.23 1.44 1.68 1.72 SB Schwankungsbreite 3 2 3 32 36 36 15.0 16.7 16.3 4.9 5.6 5.6 Bildungsspezifische Stichproben
A MR HS A MR HS A MR HS A MR HS GZ Leistungsmenge gesamt 136 131 99 644 643 572 437.5 397.8 373.9 96.0 89.5 100.6 GZ-F Leistungsmenge richtiger Reaktionen 133 128 98 641 624 566 431.1 390.3 365.0 95.1 88.6 100.1 F% Fehlerprozent 0.00 0.00 0.00 5.80 9.01 8.21 1.48 1.91 2.56 1.17 1.61 1.97 SB Schwankungsbreite 4 5 2 36 36 33 17.3 16.4 14.7 5.7 5.4 5.3
6. Rehabilitanden BFW (2007) - Zweitmessung
Datenquelle: Berufsförderungswerk (BFW) Leipzig; Dipl.-Psych. Kathrin Bemmann; 2007
Stichprobenbeschreibung:
Die Stichprobe "Rehabilitanden BFW (2007)", die auch Teil der Norm "Erwachsene, berufliche Neuorientierung" ist (zur Beschreibung siehe dort), hat den d2-C zu einem großen Teil ein zweites Mal bearbeitet, so dass die vorliegende Norm für die d2-Zweitmessung erstellt werden konnte. Zwischen Erst- und Zweitmessung lag ein zeitlicher Abstand von ca. 5 Stunden, in denen die Rehabilitanden an anderen computergestützten Tests teilgenommen haben.
N Geschlecht Alter in Jahren männlich weiblich Min. Max. Mittelwert Standardabw. Gesamtstichprobe (Ges.) 527 358 (68%) 169 (32%) 17 57 33.7 8.1 Altersspezifische Stichproben
Altersgruppe 17-35 Jahre (1) 291 191 (66%) 100 (34%) 17 35 27.7 4.7 Altersgruppe 36-57 Jahre (2) 236 167 (71%) 69 (29%) 36 57 41.1 4.4 Testwerteverteilung der Gesamtstichprobe und der Altersgruppen 1 - 2:
Minimum Maximum Mittelwert Standardabw. Ges. 1 2 Ges. 1 2 Ges. 1 2 Ges. 1 2 GZ Leistungsmenge gesamt 218 228 218 727 727 696 474.0 497.9 444.6 93.9 87.4 93.4 GZ-F Leistungsmenge richtiger Reaktionen 216 224 216 719 719 693 467.6 492.0 437.6 94.2 87.3 93.8 F% Fehlerprozent 0.00 0.00 0.00 8.20 7.32 8.20 1.42 1.23 1.65 1.29 1.10 1.46 SB Schwankungsbreite 4 4 4 39 39 34 13.3 13.1 13.5 4.9 5.0 4.8 Wie erwartet zeigen sich besonders bei den Parametern GZ und GZ-F in der Zweitmessung bessere Leistungen als in der Erstmessung. Die auftretenden Lernereffekte entsprechen den bisherigen Befunden der Papierversion des d2 (Brickenkamp, 1994) und der computergestützten Version d2-C (siehe unten, "Entwicklung der Testwerte bei Testwiederholung").
Normtabellen für Rohwertdifferenzen:
Zur Interpretation individuell ermittelter Rohwert-Differenzen zwischen Zweit- und Erstmessung werden im Folgenden Normtabellen für die Differenzen der Parameter GZ, GZ-F und F% angeboten. Entsprechende Tabellen für die Papierversion des d2 finden sich bei Wolfram, Neumann und Wieczorek (1986), die die Nutzung der Leistungsdifferenz zwischen Prä- und Posttest zur Diagnostik der konzentrativen Lernfähigkeit beschreiben. Im Unterschied hierzu zeigte sich in der vorliegenden Stichprobe keine Abhängigkeit der Differenzen vom Leistungsniveau der Erstmessung.
Für jeden Normwert der C-Skala (5+2z) ist in den Rohwertspalten das zugehörige Rohwertintervall angegeben.
Normwert
C-SkalaRohwert Δ GZ
= GZ2 - GZ1Rohwert Δ GZ-F
= GZ-F2 - GZ-F1Rohwert Δ F%
= F%2 - F%1-1 bis -75 bis -76 ab 4.08 0 -74 bis -41 -75 bis -38 3.43 bis 4.07 1 -40 bis -7 -37 bis -8 2.35 bis 3.42 2 -6 bis 17 -7 bis 19 1.62 bis 2.34 3 18 bis 37 20 bis 40 0.85 bis 1.61 4 38 bis 53 41 bis 55 0.34 bis 0.84 5 54 bis 77 56 bis 78 -0.17 bis 0.33 6 78 bis 97 79 bis 96 -0.55 bis -0.18 7 98 bis 123 97 bis 125 -1.09 bis -0.56 8 124 bis 146 126 bis 142 -2.00 bis -1.10 9 147 bis 166 143 bis 162 -3.17 bis -2.01 10 167 bis 191 163 bis 198 -4.55 bis -3.18 11 ab 192 ab 199 bis -4.56
7. Teilnehmer berufsvorbereitender Lehrgänge
Datenquelle: Kolping-Bildungswerk, Diözesanverband Paderborn e.V., Berufsförderungszentrum Hamm; T. Gurries & K. Höffgen; 2003
Stichprobenbeschreibung:
Die HTS-spezifischen Normen basieren auf den Testergebnissen von Jugendlichen zwischen 16 und 25 Jahren, die berufsvorbereitende Lehrgänge besuchen. Die Jugendlichen haben aus verschiedensten Gründen keinen Ausbildungsplatz gefunden und besuchen die Lehrgänge mit Zielen der beruflichen Orientierung, dem Erlangen der Ausbildungsreife und der nachhaltigen Platzierung auf dem Arbeitsmarkt. Die Testungen fanden in einem PC-Labor in Form von Gruppentestungen mit ca. 14 Teilnehmern statt.
Es wurde eine Gesamtnorm, sowie altersspezifische Normen eingebunden.
N Geschlecht Alter in Jahren männlich weiblich Minimum Maximum Mittelwert Gesamtstichprobe (Ges.) 210 133 (63%) 77 (37%) 16 25 19.2 Altersspezifische Stichproben Altersgruppe 16 bis 18 Jahre (1) 110 80 (73%) 30 (27%) 16 18 17.2 Altersgruppe 19 bis 25 Jahre (2) 100 53 (53%) 47 (47%) 19 25 21.4 Testwerteverteilung der Gesamtstichprobe und der Altersgruppen 1 - 2:
Minimum Maximum Mittelwert Standardabweichung Ges. 1 2 Ges. 1 2 Ges. 1 2 Ges. 1 2 GZ Leistungsmenge gesamt 221 221 300 725 637 725 465.3 436.6 477.9 80.7 76.1 80.4 GZ-F Leistungsmenge richtiger Reaktionen 143 143 297 719 632 719 445.7 424.3 469.3 84.0 80.8 81.5 F% Fehlerprozent 0.0 0.0 0.0 35.3 35.3 8.7 2.5 3.1 1.9 3.8 4.9 1.7 SB Schwankungsbreite 6 6 6 35 27 35 14.5 14.2 14.7 5.1 4.7 5.4
8. Kinder und Jugendliche mit Lern-/Verhaltensauffälligkeit
Datenquellen:
- Ambulanz der Klinik für Kinder- und Jugendpsychiatrie, SCHLEI-Klinikum Schleswig FKSL (Deutschland); Herr Dipl.-Psych. Michael Büttner; N = 253
- Klinik für Psychiatrie, Psychotherapie und Psychosomatik des Kindes- und Jugendalters, Klinikum Chemnitz (Deutschland); Herr Dipl.-Psych. Claudius Hübener; N = 132
- Sächsische Bildungsagentur, Regionalstellen Bautzen, Chemnitz, Dresden, Leipzig und Zwickau (Deutschland); Herr Dipl.-Psych. Horst Drummer; N = 384Erhebungszeitraum: 2003-2007
Stichprobenbeschreibung:
Die Stichproben der o. g. Institutionen haben sich hinsichtlich der Testkennwerte als homogen erwiesen und wurden daher zusammengefasst, um Normen für feinere Altersabstufungen zur Verfügung stellen zu können.
Die Daten wurden im Wesentlichen im Rahmen von schulpsychologischen und kinder- und jugendpsychiatrischen Abklärungen erhoben. Das heißt, die Kinder und Jugendlichen wurden bei den Einrichtungen mit einem allgemeinen Beratungsbedarf oder mit konkreten schulischen Lern- und/oder Verhaltsproblemen vorgestellt. Zu den häufigsten Auffälligkeiten gehören dabei als (Verdachts-)Diagnosen hyperkinetische Störungen (F90) und Lese-/Rechtschreibstörungen (F81.0, F81.1). Darüber hinaus finden sich u. a. isolierte Rechenstörungen oder kombinierte Störungen schulischer Fertigkeiten, Störungen des Sozialverhaltens und emotionale Entwicklungsstörungen.
Hinsichtlich der besuchten Schulformen setzt sich die Stichprobe wie folgt zusammen: 32% Grundschule, 6% Sonder-/Förderschule, 10% Hauptschule, 39% Realschule, 12% Gymnasium.
N Geschlecht Alter in Jahren männlich weiblich Min. Max. Mittelwert Standardabw. Altersgruppe 9 bis 10 Jahre (1) 246 165 (67%) 81 (33%) 9 10 9.6 0.5 Altersgruppe 11 bis 12 Jahre (2) 242 192 (79%) 50 (21%) 11 12 11.5 0.5 Altersgruppe 13 bis 14 Jahre (3) 135 104 (77%) 31 (23%) 13 14 13.6 0.5 Altersgruppe 15 bis 17 Jahre (4) 146 82 (56%) 64 (44%) 15 17 15.8 0.8 Testwerteverteilung der Altersgruppen 1 - 4:
Minimum Maximum Mittelwert Standardabweichung 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 GZ Gesamtzahl der bearbeiteten Zeichen 122 77 172 236 484 579 528 682 281 325 375 420 60 63 69 89 GZ-F Fehlerkorrigierte Gesamtleistung 106 67 156 226 477 567 516 679 270 313 365 410 59 64 70 89 F% Fehlerprozent 0 0 0 0 25 29 11 14 4.0 3.8 2.8 2.4 3.1 3.9 2.2 1.9 SB Schwankungsbreite 4 5 4 4 35 55 30 29 12.8 14.1 14.0 15.0 4.9 5.2 5.1 4.8
9. Kinder mit hyperkinetischer Störung (F90, Verdachtsdiagnose)
Datenquellen:
- Ambulanz der Klinik für Kinder- und Jugendpsychiatrie, SCHLEI-Klinikum Schleswig FKSL (Deutschland); Herr Dipl.-Psych. Michael Büttner; N = 67
- Klinik für Psychiatrie, Psychotherapie und Psychosomatik des Kindes- und Jugendalters, Klinikum Chemnitz (Deutschland); Herr Dipl.-Psych. Claudius Hübener; N = 4
- Sächsische Bildungsagentur, Regionalstellen Bautzen, Chemnitz, Dresden, Leipzig und Zwickau (Deutschland); Herr Dipl.-Psych. Horst Drummer; N = 75Erhebungszeitraum: 2003-2007
Stichprobenbeschreibung:
Die Stichproben der o. g. Institutionen haben sich hinsichtlich der Testkennwerte als homogen erwiesen und wurden daher zusammengefasst, um diese diagnosespezifische Norm zur Verfügung stellen zu können.
Die Daten wurden im Wesentlichen im Rahmen von schulpsychologischen und kinder- und jugendpsychiatrischen Abklärungen erhoben. Die Kinder wurden bei den Einrichtungen mit dem Verdacht auf eine Aufmerksamkeits-/Aktivitätsstörung untersucht.
Hinsichtlich der besuchten Schulformen setzt sich die Stichprobe wie folgt zusammen: 38% Grundschule, 1% Sonder-/Förderschule, 12% Hauptschule, 39% Realschule, 9% Gymnasium.
N Geschlecht Alter in Jahren männlich weiblich Min. Max. Mittelwert Standardabw. Gesamtstichprobe
146 127 (87%) 19 (13%) 9 12 10.7 1.0 Testwerteverteilung:
Minimum Maximum Mittelwert Standardabw. GZ Gesamtzahl der bearbeiteten Zeichen 144 509 310 60 GZ-F Fehlerkorrigierte Gesamtleistung 123 499 299 61 F% Fehlerprozent 0 26 3.6 3.2 SB Schwankungsbreite 6 36 14.5 5.2
Normierung der Tastaturversion
Für die Tastaturversion liegen altersspezifische Normen von einer zusammengefassten Stichprobe an Gesunden sowie von zwei Patientengruppen vor. Zusätzlich steht die Gesamtnorm einer Bewerberstichprobe zur Verfügung.
Das Merkmal "Schwankungsbreite" ist in den Stichproben "Gesunde" und "Patienten" nicht normiert.
1. Gesunde
Die Normalpersonen wurden als anfallende Stichproben im Rahmen dreier Diplomarbeiten gewonnen:
(1) Stichprobe I (StPr I) besteht aus 108 Personen mit einem Durchschnittsalter von 36,7 Jahren (SD = 12,4; Spannbreite 18 bis 75 Jahre), die an einer Untersuchung von Belter (1995) teilnahmen. In der Reihenfolge der Nennung wurden die folgenden Verfahren aus dem Hogrefe Testsystem durchgeführt: Visuelle Analogieskala VAS, Befindlichkeits-Skala Bf-S, Tempo-Lern-Test TLT, Untertest 3 des Leistungsprüfsystem LPS-3, Symbol-Zahlen-Lerntest SZT, Aufmerksamkeits-Belastungs-Test d2-C, Untertests 1 und 2 des Leistungsprüfsystems LPS-1/2, Umstell-Interferenz-Test JZT, Skala Cerebrale Insuffizienz c.I. An einem der beiden Folgetage wurde eine Wiederholungsmessung mit 106 Personen vorgenommen, die den d2 zunächst in der Computer- und anschließend in der Papier-und-Bleistift-Version beinhaltete.
(2) Als Stichprobe II (StPr II) wurden im Rahmen der Diplomarbeit von Schwettmann (1995) 91 Versuchspersonen mit einem Altersmittel von 29,2 Jahren (SD = 8,3; Spannbreite 18 bis 58 Jahre) rekrutiert, die in der Reihenfolge der Nennung die folgenden Verfahren durchführten: Visuelle Analogieskala VAS, Befindlichkeits-Skala Bf-S, Tempo-Lern-Test TLT, Untertests 3 bzw. 4 des Leistungsprüfsystems LPS-3, LPS-4, Symbol-Zahlen-Lerntest SZT, Aufmerksamkeits-Belastungs-Test d2-C, Umstell-Interferenz-Test JZT, Papier-und-Bleistift-Version des d2, Mehrfachwahl-Wortschatztest MWT-A.
Nach Durchführung der Papier-und-Bleistift-Form des d2 füllten alle Probanden der Stichproben I und II einen Fragebogen zur Antwortbevorzugung (acht Items) aus.
(3) Die Stichprobe III (StPr III) setzt sich aus 140 Probanden mit einem Durchschnittsalter von 34,4 Jahren (SD = 13,1; Spannbreite 18 bis 83 Jahre) zusammen, die im Rahmen einer Untersuchung von Siebert (1995) die folgenden Verfahren bearbeiteten: Visuelle Analogieskala VAS, Befindlichkeits-Skala Bf-S, revidierte Version des Eysenck Personality Questionnaire EPQ-R (Ruch, in Vorbereitung; vgl. Ruch & Hehl 1989), Deutsche Carroll Rating-Skala für Depression, Aufmerksamkeits-Belastungs-Test d2-C, Tempo-Lern-Test TLT, Untertest 3 des Leistungsprüfsystems LPS-3, Symbol-Zahlen-Lerntest SZT, Umstell-Interferenz-Test JZT, erneute Durchführung des d2-C, Mehrfachwahl-Wortschatztest MWT-A.
Die 339 Probanden der Stichproben I bis III setzen sich aus 166 männlichen und 173 weiblichen Personen zusammen. Auf Basis der vereinigten Gesundenstichprobe (N = 339) wurde eine computerspezifische, auf die Tastaturversion des d2 bezogene Norm entwickelt. Die Stichprobe wurde aufgeteilt in die zwei Altersgruppen 18 bis 40 (N = 264; 138 männlich, 126 weiblich; Altersmittel 28,4 Jahre, SD = 5,3) und 41 bis 60 Jahre (N = 59; 20 männlich, 39 weiblich; Altersmittel 48,5 Jahre, SD = 5,4). Da bislang nur wenige Daten von älteren gesunden Probanden (61 bis 83 Jahre; N = 16) vorliegen, werden diese hier nicht berücksichtigt. Zu beachten ist, dass es, wie bei anderen Aufmerksamkeitstests auch, im höheren Lebensalter eine bedeutsame Verlangsamung gibt, so dass die Normierungsdaten jüngerer Probandengruppen nicht mehr anwendbar sind. Für die Gruppe der über 60jährigen unserer Gesundenstichprobe (Altersmittel: 68,2 Jahre, SD = 6,7) beträgt GZ im Mittel nur noch 245 Zeichen (SD = 54,3), GZ-F 239 Zeichen (SD = 54,7) und F% 2,59 (SD = 1,90).
Innerhalb der ersten Altersgruppe befanden sich 2 Schüler, 13 Auszubildende, 49 Studenten, 138 Personen mit abgeschlossener Berufsausbildung, 52 mit abgeschlossener Universitäts- oder Hochschulausbildung und 10 ohne abgeschlossene Berufsausbildung. Die zweite Altersgruppe setzt sich aus 16 Universitäts- bzw. Hochschulabsolventen, 41 Personen mit und 2 ohne abgeschlossener Berufsausbildung zusammen.
Weitere statistische Angaben zur Normstichprobe der Gesunden finden sich weiter unten im Vergleich zur Patientengruppe (Tab. d2-C.3).
2. Patienten
Die Patientenstichprobe besteht aus 216 Patienten (134 männlichen und 82 weiblichen Geschlechts) mit einem Durchschnittsalter von 46,3 Jahren (SD = 15,5; Spannbreite 15 bis 81 Jahre), bei denen im Rahmen einer neuropsychologischen Diagnostik auch der d2-C angewandt wurde. Bei diesen Patienten waren die Erkrankungen in 64 Fällen (29,6 %) durch ein Schädel-Hirn-Trauma bedingt, in 68 Fällen (31,5 %) vaskulärer Genese, bei 33 Patienten (15,3 %) wurde ein Neoplasma diagnostiziert, 14 (6,5 %) wiesen eine entzündliche Erkrankung auf, bei 11 Patienten (5,1 %) wurde eine hirnatrophische Erkrankung festgestellt, für 9 Patienten (4,2 %) lautete die Diagnose (vorwiegend alkohol-)toxische Encephalopathie (einschl. Korsakow-Syndrom), in 6 Fällen (2,8 %) lag ein sog. ideopathischer Normaldruckhydrocephalus vor, 8 (3,7 %) gehörten anderen Diagnosegruppen an (M. Parkinson, B12-Avitaminose u.a.), für 3 Patienten (1,4 %) schließlich lag keine Diagnose vor.
Für diese Patientenstichprobe wurde eine gesonderte Normierung erstellt, die die drei Altersgruppen 15 bis 40 Jahre (N = 83; 53 männlich, 30 weiblich; Altersmittel 30,0 Jahre, SD = 6,7), 41 bis 60 Jahre (N = 94; 60 männlich, 34 weiblich; Altersmittel 51,5 Jahre, SD = 5,2) und 60 bis 81 (N = 39; 21 männlich, 18 weiblich; Altersmittel 68,7 Jahre, SD 4,9) umfasst.
Testwerteverteilung:
In Tabelle d2-C.3 sind Mittelwerte, Standardabweichungen, Minima und Maxima der Gesamtstichproben der Gesunden und der Patienten angegeben. Lediglich die Gesamtzahl bearbeiteter Zeichen (GZ) sowie die fehlerkorrigierten Mengenparameter GZ-F, GZ-2F und KL weisen bei graphischer Analyse eine approximative Normalverteilung auf.
Bei den im Abschnitt "Validität" dargestellten Ergebnissen (Tabelle d2-C.13) werden nach Alter, Geschlecht und Bildung parallelisierte Teilstichproben gegenübergestellt. Hier zeigt sich eine gute Übereinstimmung in der Streuung der genannten vier Testwerte.
Die Fehlermenge fällt, wie bereits aus den Normierungsdaten ersichtlich, in der Regel gering aus. Im Durchschnitt werden von den Gesunden weniger als 2 % Fehler begangen. Dass dieser Wert geringer als der entsprechende für die Papier-und-Bleistift-Form ausfällt, ist sicherlich in erster Linie auf die bedeutend größere Zeichendarstellung auf dem Bildschirm zurückzuführen, die jedoch beabsichtigt ist, um insbesondere neurologischen Patienten sowie psychiatrischen Patienten unter Neuroleptika-Medikation, die häufig eine Visusminderung angeben, nicht von vornherein zu benachteiligen.
Tab. d2-C.3: Verteilungscharakteristika der Stichproben von Gesunden und Patienten.
Minimum Maximum Mittelwert Standardabw. Normalverteilung Gesunde (N=339) GZ Leistungsmenge gesamt 153 628 372.6 84.2 ja GZ-F Leistungsmenge richtiger Reaktionen 151 625 365.7 84.0 ja GZ-2F Leistungsmenge richtiger Reaktionen (doppelte Fehlerkorrektur) 149 622 358.8 84.1 ja KL Konzentrationsleistungswert 61 263 151.8 36.3 ja F Fehlerrohwert 0 42 6.9 5.3 nein F% Fehlerprozent 0.00 8.67 1.94 1.52 nein SB Schwankungsbreite 5 39 12.8 4.3 nein Patienten (N=216) GZ Leistungsmenge gesamt 77 466 236.8 84.1 ja GZ-F Leistungsmenge richtiger Reaktionen 61 464 229.1 86.4 ja GZ-2F Leistungsmenge richtiger Reaktionen (doppelte Fehlerkorrektur) 43 462 221.3 89.3 ja KL Konzentrationsleistungswert 16 201 95.0 41.1 ja F Fehlerrohwert 0 47 7.7 7.6 nein F% Fehlerprozent 0.00 24.48 4.32 5.42 nein SB Schwankungsbreite 3 31 9.6 3.6 nein Interkorrelationen zwischen Parametern:
Diese sind für die vereinigte Gesunden- sowie für die Patientenstichprobe in Tabelle d2-C.4 wiedergegeben.
Tab. d2-C.4: Interkorrelationsmatrix der einzelnen berechneten Testparameter. Oberhalb der Diagonalen: vereinigte Gesundenstichprobe (N = 339): unterhalb der Diagonalen: Patientenstichprobe (N = 216). Produkt-Moment-Korrelationen für die Variablen GZ, GZ-F, GZ-2F und KL untereinander; sonst Rangkorrelationen nach Spearman.
GZ GZ-F GZ-2F KL F F% SB GZ Leistungsmenge gesamt - 0.998* 0.992* 0.985* 0.06 -0.20* 0.20* GZ-F Leistungsmenge richtiger Reaktionen 0.996* - 0.998* 0.992* 0.01 -0.25* 0.19* GZ-2F Leistungsmenge richtiger Reaktionen (doppelte
Fehlerkorrektur)0.987* 0.997* - 0.996* -0.04 -0.30* 0.18* KL Konzentrationsleistungswert 0.982* 0.994* 0.998* - -0.06 -0.32* 0.16* F Fehlerrohwert -0.28* -0.34* -0.39* -0.40* - 0.95* 0.09 F% Fehlerprozent -0.57* -0.61* -0.66* -0.66* 0.93* - 0.04 SB Schwankungsbreite 0.22* 0.20* 0.17* 0.17* 0.22* 0.11 - * p < 0,05
Wie zu erkennen ist, korrigieren GZ, GZ-F, GZ-2F und KL untereinander so stark, dass für den Normalbereich kaum differentielle Information durch die Verwendung verschiedener dieser Werte zu erwarten ist. Einzelfälle, bei denen sehr viele Fehler zu beobachten sind, werden hinreichend durch die Erfassung von F bzw. F% identifiziert.
Die Fehlerzahl selbst weist keine Korrelation zur Mengenleistung auf, wohl aber ist eine hohe Mengenleistung statistisch mit einer geringeren prozentualen Fehlerrate, andererseits aber auch mit einer größeren Schwankungsbreite verbunden, was sachlogisch durchaus nicht erstaunt.
3. Bewerber mittelständisches, produzierendes Unternehmen
Datenquelle: igus GmbH, Köln; Hr. Dipl.-Psych. Jörg Botor; 2000-2007
Stichprobenbeschreibung:
Die vorliegende Norm basiert auf den Daten von Teilnehmern, die den d2-C im Rahmen eines Personalauswahlprozesses bei der igus GmbH bearbeitet haben. Die igus GmbH ist ein mittelständisches Unternehmen, das verschiedene hochwertige Kunststoffteile in Deutschland selbst produziert und weltweit vertreibt.
Bei den Teilnehmern des d2-C handelt es sich vorwiegend um Hochschulabsolventen und Young Professionals (bis zu 5 Jahre Berufserfahrung), die sich für eine kaufmännische Position in den Bereichen Vertrieb, Marketing, Finanzen, Rechnungswesen oder als Ingenieur in den Bereichen Konstruktion, Entwicklung oder Fertigung bewerben. Zu einem geringeren Teil sind darüber hinaus Bewerber für den gewerblich-technischen Bereich in der Normstichprobe enthalten. Hinsichtlich des höchsten erreichten Schulabschlusses setzt sich die Stichprobe wie folgt zusammen: 65% Abitur, 26% mittlere Reife und 9% Hauptschule.
Es folgen Tabellen zur Beschreibung der Stichprobe nach Geschlecht und Alter sowie zur Verteilung der Testkennwerte.
N Geschlecht Alter in Jahren männlich weiblich Min. Max. Mittelwert Standardabw. Gesamtstichprobe
246 173 (70%) 73 (30%) 16 54 30.2 7.9 Testwerteverteilung:
Minimum Maximum Mittelwert Standardabw. GZ Gesamtzahl der bearbeiteten Zeichen 127 579 387.3 79.8 GZ-F Fehlerkorrigierte Gesamtleistung 123 570 381.4 78.9 F% Fehlerprozent 0.00 9.84 1.55 1.29 SB Schwankungsbreite 5 33 13.1 4.6
4. Neurologische Rehabilitationspatienten
Datenquelle: Neurologisches Rehabilitationszentrum Magdeburg; Dipl.-Psych. Katrin Schmitz (Chefarzt: Prof. P. W. Schönle); 2003
Stichprobenbeschreibung:
Diese Patientenstichprobe besteht aus 265 neurologischen Rehabilitationspatienten (davon 181 männlich und 84 weiblich) mit einem Durchschnittsalter von 44,6 Jahren (SD = 11,2 Spannbreite 17 bis 65 Jahre). Ca. 60% der Patienten waren aufgrund cerebrovaskulärer Erkrankungen in der Rehabilitationseinrichtung, ca. 21% aufgrund eines Schädel-Hirn-Traumas, ca. 11% wegen entzündlicher Erkrankungen und ca. 7% in Folge eines raumfordernden Prozesses. Es wurden - neben einer auf alle Daten bezogenen Norm - altersspezifische Normen gebildet. Die beiden folgenden Tabellen stellen sowohl Angaben zur Stichprobe als auch die Kennwerteverteilung in der Stichprobe dar.
N Geschlecht Alter in Jahren männlich weiblich Minimum Maximum Mittelwert Standardabw. Gesamtstichprobe (G) 265 181 (68%) 84 (32%) 17 65 44.6 11.2 Altersspezifische Stichproben
Altersgruppe 17 bis 41 Jahre (1) 95 60 (63%) 35 (37%) 17 41 32.3 7.4 Altersgruppe 42 bis 51 Jahre (2) 91 56 (62%) 35 (38%) 42 51 46.9 3.0 Altersgruppe 52 bis 65 Jahre (3) 79 65 (82%) 14 (18%) 52 65 56.7 3.4 Testwerteverteilung der Gesamtstichprobe und der Altersgruppen 1 - 3:
Minimum Maximum Mittelwert Standardabw. G 1 2 3 G 1 2 3 G 1 2 3 G 1 2 3 GZ Leistungsmenge gesamt 38 90 38 84 403 403 363 325 211.2 237.8 203.2 188.5 67.6 66.7 67.9 57.9 GZ-F Leistungsmenge richtiger Reaktionen 32 89 32 70 400 400 347 324 205.2 232.3 197.2 182.0 68.3 67.4 68.1 58.7 F% Fehlerprozent 0.00 0.00 0.00 0.00 17.05 16.79 15.79 17.05 3.38 2.60 3.63 4.03 3.43 2.95 3.50 3.75 Schwankungsbreite 0 4 1 0 22 20 19 22 10.3 10.6 10.1 10.1 3.5 3.4 3.3 3.8
Normierung der Touchscreenversion
Für die Touchscreenversion liegen alters- und geschlechtsspezifische Normen von Kindern und Jugendlichen (Patienten) vor.
1. Kinder und Jugendliche (Patienten)
Datenquelle: Klinik Sonnenhof, Kinder- und Jugendpsychiatrisches Zentrum, Ganterschwil SG, Schweiz; Herr lic. phil. Peter Lothenbach; 2005-2008
Stichprobenbeschreibung:
Die Klinik Sonnenhof ist eine spezialärztlich geleitete kinder- und jugendpsychiatrische Klinik mit eigener interner Schule. Sie bietet 34 stationäre Plätze für Kinder und Jugendliche mit emotionalen Problemen oder Verhaltensstörungen. In der vorliegenden Normstichprobe verteilen sich die häufigsten Diagnosen wie folgt: 21% Verhaltens- und emotionale Störungen mit Beginn in der Kindheit und Jugend (F90, F91, F92, F93, F98), 6% neurotische, Belastungs- und somatoforme Störungen (F40, F42, F43) sowie 3% affektive Störungen (F32).
Die Kinder und Jugendlichen haben den d2-C mittels Touchscreen bearbeitet. Anhand der vorliegenden Daten wurde eine erste Normierung der Touchscreen-Version vorgenommen, die nun in Zukunft erweitert werden kann. Da bislang noch keine Normen zu diesem Durchführungsmedium vorlagen, wurden parallel Daten mit der Papierversion des d2 erhoben. Es zeigen sich die erwarteten Äquivalenzen (s.u.). Darüber hinaus konnte anhand der Ergebnisse, die die Kinder und Jugendlichen in der Papierversion erzielten, festgestellt werden, dass sich ihre Konzentrationsleistungen nicht bedeutsam von denen gesunder Kinder und Jugendlicher unterscheiden. Die mittleren Standardwerte der vorliegenden Stichprobe (normiert an den altersspezifischen Normen der Manualstichprobe, Brickenkamp, 2002) liegen für GZ und GZ-F knapp unter 100, für F% knapp darüber, in allen Fällen jedoch innerhalb des 95%-Konfidenzintervalls: GZ: 98.0 [96.6 - 103.4], GZ-F: 98.2 [97.2 - 102.8], F%: 101.7 [96.6 - 103.4]. Die gewonnen Normen können daher auch zur Ergebnisinterpretation unauffälliger Kinder und Jugendlicher genutzt werden.
Ein Drittel der Kinder besuchte zum Zeitpunkt des Tests die Primarschule oder eine Kleinklasse, zwei Drittel eine Oberstufenklasse. Die folgende Tabelle beschreibt die Stichprobe nach Alter und Geschlecht.
N Geschlecht Alter in Jahren männlich weiblich Min. Max. Mittelwert Standardabw. Gesamtstichprobe (Ges.) 193 101 (52%) 92 (48%) 9 17 13.8 2.1 Geschlechtsspezifische Stichproben
Männlich (m) 101 101 (100%) - 9 17 13.5 2.3 Weiblich (w) 92 - 92 (100%) 9 17 14.2 1.9 Normierung (Continuous Norming):
Die Ergebnisparameter GZ und GZ-F erwiesen sich wie erwartet als stark altersabhängig: Brickenkamp (2002) berichtete von einem "substanziellen Zusammenhang" der Parameter mit dem Alter von r = .6 bis r = .7 (S. 60); in der vorliegenden Stichprobe liegt die Korrelation bei r = .53 für die Touchscreen-Version und .52 bzw. .53 für die Papierversion. Um trotz der eingeschränkten Stichprobengröße altersspezifische Normen bereitstellen zu können, wurde zur Normberechnung das Verfahren des 'Continuous Norming' genutzt (vgl. u. a. Zachary & Gorsuch, 1985; Van Breukelen & Vlaeyen, 2005). Hierbei erlaubt die lineare Regression der Testwerte, kontinuierliche und stabile Normen für Teilstichproben zu ermitteln, ohne durch die Aufspaltung der Gesamtstichprobe jeweils einen erheblichen Informationsverlust hinnehmen und innerhalb der Teilgruppen auf erheblich reduzierte Stichproben zurückgreifen zu müssen. Als Prädiktor wurde in den Regressionen das Alter (in Jahren) genutzt.
Die Ergebnisparameter F% und SB weisen keine signifikanten Alterseffekte auf, daher wurden sie unabhängig vom Alter und mittels der bekannten Flächentransformation normiert (gleiche Normtabellen für alle Altersgruppen).Parallelität der Touchscreen- und Papierversion:
Da die Kinder und Jugendlichen der vorliegenden Stichprobe den d2-C sowohl am Touchscreen als auch in der Papierversion bearbeitet haben, kann anhand der Ergebnisse die Parallelität der Testformen untersucht werden. Die Reihenfolge der Testbearbeitung war ebenso wie das Intervall zwischen den Testungen individuell sehr unterschiedlich, letzteres betrug zwischen wenigen Tagen und vier Monaten. Die Korrelation der jeweiligen Rohwerte beträgt für GZ und GZ-F jeweils r = .82, die Korrelation der jeweiligen Normwerte r = .73. Obwohl es sich bei der Computerversion nicht um eine 1:1-Umsetzung der Papierversion handelt (s.o. zur Beschreibung der Computerversion), sprechen diese Ergebnisse für die weitgehende Übereinstimmung der von den beiden Testformen erfassten Konstrukte.
Die berichteten Werte liegen hier für die Touchscreen-Version sogar etwas höher als die entsprechenden Koeffizienten des Vergleichs von Maus- und Papierversion (s.u.). Als Ursache kann hier neben den Unterschieden in der Stichprobe und des Test-Retest-Intervalls die einfachere Bedienbarkeit des Touchscreens vermutet werden. Insbesondere bei Personen, die im Umgang mit der Maus ungeübt sind, ist daher die Nutzung der Touchscreens zu empfehlen.Geschlechtsspezifik:
Für die vorliegende Stichprobe der Kinder und Jugendlichen haben sich geschlechtsspezifische Unterschiede in den Ergebnissen gezeigt: Mädchen bearbeiten im Durchschnitt mehr Zeichen (GZ, GZ-F) und machen dabei weniger Fehler (F%) als Jungen. Die geschlechtsspezifischen Unterschiede zeigen sich dabei in gleichem Ausmaß für die Touchscreen- wie für die Papierversion: Die jeweilige Effektstärke beträgt für GZ -.53 bzw. -.51, für GZ-F in beiden Formen -.54 und für F% .29 bzw. .30. Zusätzlich zu den altersspezifischen Normen der Gesamtgruppe wurden daher alters- und geschlechtsspezifische Normen berechnet. Das Geschlecht wurde hierbei als zusätzliche dummy-Variable in die Regressionsgleichungen des Continuous Norming aufgenommen.
Der Befund geschlechtsspezifischer Unterschiede stimmt mit den Daten der 8. Auflage des d2-Manuals überein (Brickenkamp, 1994), in dem geschlechtsspezifische Normen für den Altersbereich zwischen 9 und 20 Jahren angeboten wurden. In der Eichstichprobe der 9. Auflage waren dagegen keine Geschlechtseffekte mehr nachweisbar (Brickenkamp, 2002). Die relative Konzentrationsschwäche der Jungen findet sich in zahlreichen Studien auch bei anderen Aufmerksamkeitstests - Naglieri & Rojahn (2001) berichten z.B. eine mittlere Effektstärke des Unterschieds von d = .36 - und verliert sich mit dem Erreichen des Erwachsenenalters.
Altersspezifische Testwerteverteilung der Gesamtstichprobe und der geschlechtsspezifischen Normgruppen für die Ergebnisparameter GZ und GZ-F:
Anstelle der klassischen Verteilungskennwerte (Minimum, Maximum, Mittelwert, Standardabweichung) werden beim Continuous Norming die anhand der Regressionsgleichungen vorhergesagten Testwerte (Ŷ) und die Standardabweichung der Residuen s(e) angegeben.
vorhergesagte Werte (Ŷ) s(e) Alter 9 10 11 12 13 14 15 16 17 GZ Gesamtzahl der
bearbeiteten ZeichenGes. 302.2 326.7 351.2 375.7 400.2 424.8 449.3 473.8 498.3 83.2 m 291.1 314.4 337.7 361.0 384.3 407.6 430.9 454.2 477.5 81.3 w 326.7 350.0 373.3 396.6 419.9 443.2 466.5 489.8 513.1 GZ-F Fehlerkorrigierte
GesamtleistungGes. 292.0 316.1 340.2 364.4 388.5 412.7 436.8 461.0 485.1 82.6 m 280.6 303.5 326.4 349.3 372.2 395.1 418.0 440.9 463.7 80.7 w 317.1 .40.0 362.9 385.7 408.6 431.5 454.4 477.3 500.2 Testwerteverteilung der Gesamtstichprobe und der geschlechtsspezifischen Normgruppen für die Merkmale F% und SB:
Minimum Maximum Mittelwert Standardabw. Ges. m w Ges. m w Ges. m w Ges. m w F% Fehlerprozent 0.00 0.00 0.00 8.65 8.65 8.60 2.96 3.23 2.67 1.94 2.04 1.78 SB Schwankungsbreite 5 5 6 24 24 22 14.3 13.9 14.6 3.9 4.0 3.7
Gütekriterien
Reliabilität
Zur Beurteilung der Reliabilität der verschiedenen Parameter des d2-C wurden interne Konsistenzen (Cronbachs Alpha und Split-half-Reliabilitäten) sowie Test-Retest-Korrelationen berechnet. Tabelle d2-C.5 enthält die Werte der Konsistenzschätzungen über die Serien 1 bis 12 für die Gesamtstichproben der 339 Gesunden und 216 Patienten, getrennt für die drei Unterstichproben der Gesunden sowie für die Wiederholungstestdurchgänge der Stichproben I und II. Die Split-half-Reliabilitäten wurden getrennt nach obere vs. untere Testhälfte sowie gerade vs. ungerade Seriennummer berechnet.
Tab. d2-C.5: Werte der internen Konsistenz für den d2-C, berechnet für die jeweils erste Testdurchführung der Patienten-, Gesunden- und drei Teilstichproben sowie für die Wiederholungstestdurchführung.
GZ GZ-F GZ-2F KL F Cronbachs Alpha Gesunde gesamt 0.977 0.979 0.976 0.975 0.681 StPr I 0.977 0.979 0.977 0.975 0.687 StPr II 0.963 0.964 0.960 0.953 0.717 StPr III 0.980 0.980 0.979 0.978 0.603 Retest StPr I 0.982 0.983 0.982 0.980 0.578 Retest StPr III 0.985 0.985 0.984 0.982 0.628 Patienten 0.986 0.987 0.987 0.986 0.822 Split half obere vs. untere Testhälfte1 Gesunde gesamt 0.954 0.956 0.954 0.953 0.638 StPr I 0.952 0.954 0.952 0.949 0.694 StPr II 0.933 0.934 0.931 0.923 0.681 StPr III 0.959 0.960 0.959 0.960 0.479 Retest StPr I 0.975 0.977 0.977 0.976 0.488 Retest StPr III 0.974 0.974 0.974 0.974 0.678 Patienten 0.973 0.954 0.977 0.977 0.802 Split half gerade vs. ungerade Seriennummern1 Gesunde gesamt 0.983 0.984 0.982 0.980 0.828 StPr I 0.988 0.990 0.989 0.985 0.845 StPr II 0.973 0.974 0.973 0.967 0.810 StPr III 0.981 0.981 0.979 0.978 0.815 Retest StPr I 0.987 0.986 0.984 0.980 0.771 Retest StPr II 0.986 0.986 0.984 0.980 0.781 Patienten 0.990 0.991 0.991 0.991 0.924 1 Mit Equal-length-Korrektur.
Für die GZ und die fehlerkorrigierten Mengenwerte fallen trotz geringer Serienzahl die Werte der internen Konsistenz überraschend hoch aus und können als sehr zufrieden stellend betrachtet werden. Anders verhält es sich für die Konsistenzschätzungen der Fehlerzahl. Dabei ist jedoch zu berücksichtigen, dass die Fehlerzahl pro Serie bei Gesunden in der Regel gering ausfällt und außerdem bestimmte Bearbeitungsdynamiken innerhalb des Tests zum Tragen kommen, z.B. höhere Fehlerraten zu Beginn des Tests oder im Gegenteil Motivationsverlust mit größerer Ungenauigkeit im Verlaufe des Tests. Demzufolge fallen die Split-half-Reliabilitäten gerade vs. ungerade Seriennummern höher als die für obere vs. untere Testhälfte aus und erreichen ein zumindest noch akzeptables Niveau.
Für die Stichproben I (Retest-Intervall 1 bis 2 Tage) und III (Retest-Intervall ca. 30 Minuten) sind die Interkorrelationsmatrizen der einzelnen berechneten Parameter zwischen Prä- und Posttestung in Tabelle d2-C.6 dargestellt. Die fett gedruckten Koeffizienten geben Retest-Reliabilitäten an. Wiederum sind die geschätzten Werte für die Gesamtzahl der bearbeiteten Zeichen sowie für die fehlerkorrigierten Mengenparameter als sehr zufrieden stellend anzusehen, nicht jedoch für die Fehlerzahl und die Fehlerprozent. Für die Schwankungsbreite erreichen die Test-Retest-Korrelationen kein Signifikanzniveau.
Tab. d2-C.6: Interkorrelationsmatrizen zwischen den Parametern im Prä- und im Retest. Produkt-Moment-Korrelationen für die Variablen GZ, GZ-F, GZ-2F und KL untereinander; sonst Rangkorrelationskoeffizienten nach Spearman.
StPr I (N = 106) RETEST PRÄTEST GZ GZ-F GZ-2F KL F F% SB GZ Leistungsmenge gesamt 0.91* 0.92* 0.91* 0.91* -0.19 -0.41* 0.18 GZ-F Leistungsmenge richtiger Reaktionen 0.92* 0.92* 0.92* 0.92* -0.22* -0.44* 0.16 GZ-2F Leistungsmenge richtiger Reaktionen (doppelte Fehlerkorrektur) 0.92* 0.92* 0.92* 0.92* -0.24* -0.46* 0.15 KL Konzentrationsleistungswert 0.92* 0.92* 0.93* 0.92* -0.25* -0.47* 0.13 F Fehlerrohwert -0.02 -0.03 -0.04 -0.03 0.37* 0.35* 0.10 F% Fehlerprozent -0.27* -0.28* -0.29* -0.29* 0.44* 0.48* 0.06 SB Schwankungsbreite 0.25* 0.24* 0.23* 0.22* 0.15 0.09 0.06 StPr III (N = 138) RETEST PRÄTEST GZ GZ-F GZ-2F KL F F% SB GZ Leistungsmenge gesamt 0.88* 0.88* 0.88* 0.87* -0.10 -0.30* 0.20 GZ-F Leistungsmenge richtiger Reaktionen 0.88* 0.88* 0.88* 0.88* -0.13 -0.32* 0.20 GZ-2F Leistungsmenge richtiger Reaktionen (doppelte Fehlerkorrektur) 0.88* 0.88* 0.88* 0.88* -0.15 -0.34* 0.19 KL Konzentrationsleistungswert 0.88* 0.88* 0.88* 0.88* -0.16 -0.35* 0.19 F Fehlerrohwert -0.05 -0.07 -0.09 -0.09* 0.51* 0.50* 0.04 F% Fehlerprozent -0.28* -0.30* -0.32* -0.32* 0.51* 0.56* -0.05 SB Schwankungsbreite 0.24* 0.24* 0.24* 0.24* 0.02 -0.04 0.14 Tabelle d2-C.7 gibt die Test-Retest-Korrelationen der einzelnen Messwerte bei Patienten für drei unterschiedliche Retest-Intervalle wieder. Die einzelnen Gruppen weisen hinsichtlich Alter und Ausgangsleistung im d2 keine systematischen Unterschiede auf. Die bisherigen Stichprobenumfänge für unterschiedliche Retest-Intervalle, insbesondere die für diese Darstellung noch notwendige Zusammenfassung der Intervalle 4 bis 18 Tage, gestatten jedoch noch keine gesicherten Aussagen über die Entwicklung der Retest-Reliabilität mit wachsendem Zeitintervall. Zusammenfassend zeichnet sich jedoch ein Trend zu etwas höheren Reliabilitätskoeffizienten - sowohl bezüglich internen Konsistenz- als auch Stabilitätswerten - für die Patientengruppe ab.
Tab. d2-C.7: Test-Retest-Reliabilitätskoeffizienten für neurologische Patienten mit unterschiedlichen Retest-Intervallen. Produkt-Moment-Korrelationen für die Variablen GZ, GZ-F, GZ-2F und KL untereinander; sonst Rangkorrelationskoeffizienten nach Spearman.
Intervall 1 Tag
(N=36)Intervall 2 - 3 Tage
(N=34)Intervall 4 - 18 Tage
(N=36)GZ Leistungsmenge gesamt 0.95* 0.96* 0.92* GZ-F Leistungsmenge richtiger Reaktionen 0.95* 0.96* 0.94* GZ-2F Leistungsmenge richtiger Reaktionen (doppelte Fehlerkorrektur) 0.95* 0.97* 0.94* KL Konzentrationsleistungswert 0.95* 0.96* 0.93* F Fehlerrohwert 0.57* 0.36* 0.78* F% Fehlerprozent 0.66* 0.60* 0.81* SB Schwankungsbreite 0.20 0.19 0.08 * p < 0,05
Entwicklung der Testwerte bei Testwiederholung
Während Retest-Reliabilitäten zwar Aussagen über den korrelativen Zusammenhang zwischen den gemessenen Werten bei Testwiederholung gestatten, sind für eine angemessene Beurteilung von Leistungsverbesserungen (zum Beispiel infolge Spontanremission oder durch Therapieerfolg) die üblicherweise erzielten Leistungsgewinne zu berücksichtigen, die auch durch die bloße Vertrautheit mit der Anforderung bereits zustande kommen können. So konnten Westhoff und Dewald (1990) nachweisen, dass "Leistungen in Konzentrationstests ... durch einfache Wiederholung stark gesteigert werden" können (S. 44), andererseits jedoch ein Übungstransfer auf andere Konzentrationstests nicht stattfindet. Auch Fay und Meyer (1993) fanden für den Bonner Konzentrationstest deutliche Leistungssteigerungen und eine Abnahme des Fehlerprozentwertes zwischen Erst- und Zweittestung. Wolfram, Neumann und Wieczorek (1986) basieren auf dieser Leistungssteigerung ihren "Konzentrativen Lerntest d2", interpretieren Leistungszuwächse im Sinne einer "konzentrativen Lernfähigkeit" und führen sie auf die zwischen den beiden Testdurchführungen liegende ca. 15minütige Bearbeitung zweier anderer Testverfahren zurück.
Auch für den d2-C wurden solche Leistungssteigerungen zwischen Prä- und Posttestung festgestellt, wie in Tabelle d2-C.8 dargestellt ist. Die Parameter GZ, GZ-F, GZ-2F und KL zeigen signifikante Zuwächse für alle Gruppen und Retest-Intervalle (Prüfung mit t-Test für verbundene Stichproben). Auch die Veränderungen in den anderen Parametern, das heißt geringere absolute Fehlerzahlen, geringere prozentuale Fehlerraten und geringere Schwankungsbreiten, sind für die beiden Gesundengruppen signifikant (Prüfung mittels Wilcoxon-Rangvorzeichentest), während die Unterschiede bei den Patientengruppen mit geringeren Stichprobenumfängen nur für F% bei den Retest-Intervallen 1 Tag und 4 bis 18 Tage und F für 4 bis 18 Tage statistische Signifikanz erreichen.
Insgesamt fallen, wie zu sehen ist, die Leistungszuwächse für Patienten bedeutend niedriger aus. Für eine differentielle Betrachtung der Unterschiede zwischen Gesunden und hirnorganisch Erkrankten sowie für verschiedene Retest-Intervalle wären jedoch systematische Untersuchungen nötig, die bislang nicht durchgeführt wurden.
Für die bislang vorliegenden Ergebnisse kann jedoch konstatiert werden, dass für keine der untersuchten Gruppen und Retest-Intervalle eine statistisch nachweisbare Abhängigkeit der Leistungszuwächse in den Mengenparametern vom Ausgangsniveau dieser Variablen vorliegt.
Tab. d2-C.8: Veränderungen in den ausgewerteten Parametern des d2-C zwischen Erst- und Zweittestung für verschiedene Stichproben und Retest-Intervalle.
Gesunde Patienten Retest-Intervall ca. 30 min (N=106) 1 bis 2 Tage (N=138) 1 Tag (N=36) 2 bis 3 Tage (N=34) 4 bis 18 Tage (N=36) m (SD) m (SD) m (SD) m (SD) m (SD) GZ Leistungsmenge gesamt 50.48 (34.19) 71.70 (50.17) 36.28 (31.22) 37.85 (28.13) 31.89 (26.93) GZ-F Leistungsmenge richtiger Reaktionen 52.87 (33.12) 72.72 (49.92) 38.17 (31.35) 39.03 (27.67) 34.67 (24.61) GZ-2F Leistungsmenge richtiger Reaktionen (doppelte Fehlerkorrektur) 55.25 (32.84) 73.75 (49.96) 40.06 (32.68) 40.21 (28.43) 37.44 (24.34) KL Konzentrationsleistungswert 24.09 (13.77) 31.11 (21.13) 18.64 (14.72) 18.00 (14.07) 17.58 (11.87) F Fehlerrohwert -2.39 (5.20) -1.02 (3.82) -1.89 (6.17) -1.18 (5.87) -2.78 (7.29) F% Fehlerprozent -0.87 (1.41) -0.51 (1.04) -1.37 (3.62) -0.93 (3.19) -2.49 (4.26) SB Schwankungsbreite -1.14 (4.99) -1.35 (5.86) -0.53 (3.61) 0.24 (4.51) -1.03 (5.17)
Beziehungen Computer- und Papier-und-Bleistift-Form
Wie aus der Beschreibung der Konstruktion des d2-C hervorgeht, handelt es sich nicht um eine 1:1-Umsetzung der Papier-und-Bleistift-Version auf den Computer, was auch kaum befriedigend gelingen dürfte. Insofern ist auch keine strikte Äquivalenz zwischen beiden Verfahren zu erwarten, wohl aber eine Ähnlichkeit auf der Ebene des erfassten Konstruktes "selektive Aufmerksamkeit"; die hier dargestellten Daten sind also im Sinne eines Validitätsnachweises zu bewerten.
Tabelle d2-C.9 enthält für die Stichproben I und II die Korrelationen zwischen den Parametern der Computerversion und der Papier-und-Bleistift-Version des d2. In jedem Falle wurde der d2-C zuerst durchgeführt, im Falle der Stichprobe I zweimal vor Durchführung der Papier-und-Bleistift-Form.
Die Korrelationen zwischen den fehlerkorrigierten Mengenparametern sind als durchaus zufrieden stellend anzusehen und fallen bei unmittelbar aufeinander folgender Durchführung des d2-C (Retest) und des d2-PP höher aus. Demgegenüber sind für die anderen Parameter kaum zufrieden stellende Werte zu erreichen, insbesondere gilt dies für die Schwankungsbreite.
Eine ähnliche Korrelationsmatrix zwischen einem Computerverfahren und der Papier-und-Bleistift-Version des d2 ist übrigens für den Bonner Konzentrationstest von Fay & Meyer (1993, S. 38, Tabelle 5) gefunden worden.
Akzeptanz der Computer-Form
Die Beurteilung erfolgte mittels eines 8-Item-Fragebogens zur Antwortbevorzugung. Er wurde bei den Stichproben I und II anschließend an die Durchführung beider Versionen vorgegeben. Insbesondere sollten die Probanden beurteilen, (1) auf welche der beiden Formen des d2 sie sich besser konzentrieren konnten, (2) welche Form ihnen angenehmer war, (3) mit welcher Form sie lieber fortfahren würden, wenn sie noch mehr solcher Aufgaben lösen sollten, (4) welche Variante leichter fiel, (5) welche Form sie in einer Bewerbungssituation wählen würden, (6) wo sie mehr Spaß hatten, (7) wo sie die Aufgaben besser erfassen konnten und schließlich (8) bei welcher Form die Zeit für sie schneller verging. Für jede Frage sollte eine Entscheidung entweder zugunsten der Papier-und-Bleistift-Version oder der Computerversion oder Indifferenz (kein Unterschied) getroffen werden; diese Alternativen wurden zur Auswertung mit 1, 3 bzw. 2 Punkten bewerten.
Tabelle d2-C.10 zeigt die Antworten der Probanden, getrennt für beide Stichproben, auf die einzelnen Fragen. Unter Außerachtlassung der Indifferenzentscheidungen wurden die Unterschiede in der Wahl zwischen den beiden Versionen mittels Binomialtest geprüft. In der Tabelle angegeben ist das jeweilige Signifikanzniveau. Ein Summenwert wurde über alle acht Items berechnet, dessen Indifferenzpunkt bei 16 läge; damit wurden für den Binomialtest alle Werte unter 16 denen über 16 Punkten gegenübergestellt.
Tab. d2-C.9: Interkorrelationen zwischen den Testparametern von d2-C und d2-PP. Stichprobe I: N = 108 für die Prä- und N = 106 für die Posttestung; Stichprobe II: N = 91. Produkt-Moment-Korrelationen für die Variablen GZ, GZ-F, GZ-2F und KL untereinander; sonst Rangkorrelationskoeffizienten nach Spearman.
StPr I PRÄTESTUNG d2-PP d2-C GZ GZ-F GZ-2F KL1 F F% SB GZ Leistungsmenge gesamt 0.63* 0.70* 0.74* 0.72* -0.20* -0.32* -0.14 GZ-F Leistungsmenge richtiger Reaktionen 0.63* 0.71* 0.75* 0.73* -0.22* -0.34* -0.16 GZ-2F Leistungsmenge richtiger Reaktionen (doppelte Fehlerkorrektur) 0.63* 0.71* 0.76* 0.74* -0.25* -0.36 -0.17 KL Konzentrationsleistungswert 0.63* 0.71* 0.76* 0.75* -0.25* -0.37* -0.16 F Fehlerrohwert 0.06 -0.02 -0.09 -0.13 0.34* 0.32* 0.13 F% Fehlerprozent -0.13 -0.23* -0.32* 0.35* 0.40* 0.42* 0.17 SB Schwankungsbreite 0.23* 0.19* 0.15 0.10 0.03 0.02 -0.18 StPr I POSTTESTUNG d2-PP d2-C GZ GZ-F GZ-2F KL1 F F% SB GZ Leistungsmenge gesamt 0.69* 0.75* 0.78* 0.75* -0.17 -0.30* -0.13 GZ-F Leistungsmenge richtiger Reaktionen 0.69* 0.75* 0.78* 0.76* -0.19* -0.32* -0.13 GZ-2F Leistungsmenge richtiger Reaktionen (doppelte Fehlerkorrektur) 0.68* 0.75* 0.79* 0.76* -0.21* -0.34* -0.14 KL Konzentrationsleistungswert 0.67* 0.75* 0.78* 0.76* -0.22* -0.35* -0.14 F Fehlerrohwert -0.08 -0.17 -0.28* -0.31* 0.51* 0.53* 0.21* F% Fehlerprozent -0.27* -0.36* -0.47* -0.49* 0.52* 0.57* 0.23* SB Schwankungsbreite 0.02 -0.01 -0.02 0.02 0.11 0.10 0.06 StPr II GZ GZ-F GZ-2F KL1 F F% SB GZ Leistungsmenge gesamt 0.62* 0.65* 0.65* 0.72* -0.05 -0.17 -0.22* GZ-F Leistungsmenge richtiger Reaktionen 0.62* 0.65* 0.66* 0.71* -0.08 -0.20 -0.23* GZ-2F Leistungsmenge richtiger Reaktionen (doppelte Fehlerkorrektur) 0.61* 0.64* 0.66* 0.69* -0.10 -0.23* -0.23* KL Konzentrationsleistungswert 0.60* 0.64* 0.66* 0.67* -0.12 -0.25* -0.23* F Fehlerrohwert 0.16 0.10 0.04 0.27* 0.30* 0.28* -0.07 F% Fehlerprozent 0.03 -0.03 -0.09 0.05 0.30* 0.31* -0.01 SB Schwankungsbreite 0.26* 0.26* 0.23* 0.27* 0.03 -0.02 0.15 1 Für Stichprobe II wurden die KL-Werte der PP-Version nur für N = 31 Probanden ausgewertet.
* p < 0,05.Tab. d2-C.10: Antworten in Stichproben I (N = 106) und II (N = 91) hinsichtlich der Bevorzugung einer Version des d2, Signifikanz der Binomialtests und Kendall-Rangkorrelation zwischen dem Item und dem Selbsturteil hinsichtlich Vertrautheit mit Computern. Obere Angaben: Stichprobe I; untere Angaben: Stichprobe II.
Item Mittelwert Bevorzugung Binomialtest Korrelation
mit Vertrautheitd2-PP Indifferenz d2-C (1) Besser konzentrieren 2.65 13 11 82 0.000 -0.01 2.25 27 14 50 0.012 0.06 (2) Angenehmer 2.68 12 10 84 0.000 0.10 2.32 28 6 57 0.002 0.15 (3) Fortsetzungsbevorzugung 2.70 11 10 85 0.000 0.00 2.42 23 7 61 0.000 0.10 (4) Leichter 2.59 16 11 79 0.000 0.07 2.24 25 19 47 0.013 0.11 (5) Bevorzugung in Bewerbungssituation 2.54 21 7 78 0.000 0.01 2.22 31 9 51 0.036 0.12 (6) Mehr Spaß 2.71 6 19 81 0.000 0.01 2.52 15 14 62 0.000 0.09 (7) Bessere Auffassung 2.48 11 33 62 0.000 -0.03 2.10 23 36 32 0.281 0.10 (8) Zeit schneller vergangen 1.89 50 18 38 0.241 -0.20* 1.65 53 17 21 0.000 0.08 Gesamtpunkte1 20.24 18 3 85 0.000 -0.07 17.71 28 3 60 0.001 0.12 1 Für diesen Wert wurde der Indifferenzpunkt mit 16 Punkten (8 x 2) festgelegt; vgl. Text.
* p < 0,05Des weiteren sind die Kendall-Rangkorrelationen mit der selbstbeurteilten Vertrautheit mit Computern angegeben (6-Punkte-Rating). Wie die Ergebnisse zeigen, hängt die Bevorzugung einer der beiden Versionen nicht mit der persönlichen Erfahrung mit Computern zusammen.
Für beide Gruppen wird eine deutliche Bevorzugung der Computerversion im subjektiven Urteil hinsichtlich der meisten Items festgestellt, wobei die Unterschiede für die Stichprobe I bedeutend ausgeprägter erscheinen. Ob die zweimalige Durchführung des d2-C für diesen Unterschied verantwortlich ist, kann im Rahmen des Versuchsplans nicht beantwortet werden.
Im Gegensatz zu Ergebnissen einer Studie zur Bearbeitung eines Fragebogens (EPQ-R) wird für den d2 angegeben, dass die Zeit bei der Papier-und-Bleistift-Form im Stichprobenmittel eher schneller verging (Signifikanz jedoch lediglich für Stichprobe II erreicht). Dies widerspiegelt aber nur den Unterschied in den tatsächlichen Zeitverhältnissen (PP: 14 Serien à 20 Sekunden = 4:40 Minuten; Computer: 12 Serien à 30 Sekunden = 6:00 Minuten).
Validität
Wie bereits aus der Darstellung der Normierungsdaten deutlich wurde, ist die Leistung im d2-C altersabhängig. Für die Gesamtstichprobe der Gesunden ergibt sich eine Korrelation zwischen dem Alter und GZ bzw. GZ-F in Höhe von jeweils r = -0,49 (Patienten: r = -0,43 bzw. -0,44). Die Fehlerzahl korreliert nur für die Patienten mit dem Alter (rS = 0,25), für beide Gruppen gibt es einen signifikanten Zusammenhang zwischen Alter und F% (Spearman-Rangkorrelation: rS = 0,14; Patienten: rS = 0,37).
Der Zusammenhang mit dem Bildungsniveau (Anzahl der Ausbildungsjahre) ist ebenfalls signifikant, wenn auch kleiner als der Alterseinfluss (Angaben jeweils für Gesunde und Patienten - GZ: jeweils r = 0,27; GZ-F: r = 0,28 bzw. 0,27; F: rS = -0,07 n.s. bzw. -0,17; F%: rS = -0,15 bzw. -0,26).
Für die Gesamtgruppe der Gesunden wurde weiterhin festgestellt, dass Probanden, die eine größere Erfahrung im Umgang mit Computern angeben, eine größere Mengenleistung im Test erreichen (Korrelation mit GZ bzw. GZ-F: rS = 0,29), obgleich dieser Zusammenhang relativ gering ausfällt. Keine Beziehung besteht zu F und F%.
Bei der Prüfung auf Geschlechtsunterschiede stellte sich für die Gesundenstichprobe ein zwar signifikanter (t-Test: p < 0,05), aber relativ geringer Zusammenhang mit GZ und GZ-F heraus, der eine weniger als ein Viertel der Standardabweichung betragende etwas höhere Leistung für die männlichen Probanden betrifft, so dass in Anbetracht der bislang vorliegenden Stichprobenumfänge auf eine geschlechtsspezifische Normierung verzichtet wird. Die männlichen Probanden wiesen auch etwas geringere F%-Werte auf. Keine solchen Unterschiede ließen sich für die Patientenstichprobe nachweisen.
Zur Prüfung der kriterienbezogenen Validität sind in Tabelle d2-C.11 für die Gesundenstichprobe die Korrelationen der einzelnen Testwerte mit den anderen in den drei Teilstichproben durchgeführten Verfahren aus dem Hogrefe Testsystem angegeben. Da sowohl für die Parameter des d2-C als auch für die hier ausgewählten Werte der anderen Verfahren relativ häufig grobe Abweichungen von einer Normalverteilung beobachtet wurden, sind einheitlich die Spearman-Rangkorrelationskoeffizienten dargestellt. Befriedigend hohe Zusammenhänge ergeben sich erwartungsgemäß zwischen den Parametern GZ, GZ-F, GZ-2F, KL und konstruktnahen Testwerten, d. h. die Mengenleistung im SZT und die Reaktionszeit im JZT. Demgegenüber ist zwar ein Zusammenhang mit der psychomotorischen Reaktionsgeschwindigkeit (TLT) nachweisbar, er fällt aber sehr gering aus. Die Zusammenhänge zu verbalen und nonverbalen Intelligenzmaßen (LPS-1 bis -4) liegen im mittleren Bereich. Dabei ist zu berücksichtigen, dass diese Aufgaben zeitbegrenzt zu lösen sind und die Ergebnisse damit - wie auch im d2 - deutlich tempoabhängig sind. Hingegen fällt die Korrelation zum Punktwert im MWT-A deutlich niedriger aus. Die aktuelle Befindlichkeit weist keine erkennbare Beziehung zur Leistungsmenge im d2-C auf. Mehr in der c.I.-Skala selbstgeschilderte Leistungs- und psychovegetative Probleme gehen allerdings mit einer geringen Mengenleistung einher, wobei hier das Lebensalter als konfundierende Variable zu berücksichtigen wäre.
Für die anderen drei Kennwerte, F, F% und SB, sind die Daten hingegen kaum zufrieden stellend. Allenfalls die Genauigkeitsleistung (F%) weist statistisch vergleichsweise niedrige Zusammenhänge zu Intelligenzparametern, zum psychomotorischen Reaktionstempo und zur Genauigkeitsleistung im SZT (rS = 0,16) auf.
Damit wird noch einmal unterstrichen, dass der wichtigste interpretierbare Wert die fehlerkorrigierte Mengenleistung sein dürfte und die Genauigkeitsleistung lediglich bei gröberen Abweichungen von der Norm valide Zusatzinformation liefern könnte.
Tab. d2-C.11: Rangkorrelationskoeffizienten zwischen den Testwerten des d2-C und anderen Verfahren für die Gesundenstichprobe. Die unterschiedlichen Probandenzahlen ergeben sich aus den verschiedenen Versuchsplänen der Teilstichproben I bis III.
N GZ GZ-F GZ-2F KL F F% SB MWT-A, Richtige 230 0.20* 0.21* 0.22* 0.22* -0.18* -0.23* -0.01 LPS-1/2, Richtige 108 0.41* 0.41* 0.41* 0.41* -0.07 -0.19 0.04 LPS-3, Richtige im 1. Versuch 277 0.56* 0.57* 0.58* 0.58* -0.24* -0.39* 0.14* LPS-4, Richtige im 1. Versuch 91 0.37* 0.38* 0.40* 0.40* -0.09 -0.16 0.19 TLT, mittlere Reaktionszeit 339 -0.27* -0.28* -0.28* -0.28* 0.11* -0.20* -0.17* TLT, SD der Reaktionszeit 339 -0.20* -0.21* -0.22* -0.22* 0.17* 0.23* -0.07 SZT, Mengenleistung 1.-3. Serie 339 0.71* 0.71* 0.72* 0.72* -0.07 -0.26* 0.17* SZT, Fehlermenge 1.-3- Serie 339 0.19* 0.18* 0.17* 0.16* 0.14* 0.09 0.16* SZT, Fehlerprozent 339 0.03 0.02 0.01 0.00 0.18* 0.16* 0.12* JZT, mittlere Reaktionszeit 339 -0.65* -0.66* -0.66* -0.66* 0.05 0.22* -0.14* VAS: Befindlichkeit 339 0.04 0.04 0.05 0.05 0.03 0.01 -0.01 Bf-S: Befindlichkeitsstörungen 337 0.08 0.09 0.08 0.07 0.03 0.01 0.07 Leistungsbeschwerden (c.I.-Skala) 108 -0.31* -0.30* -0.29* -0.29* -0.11 -0.04 -0.09 Depressive Symptome (CRS_D) 200 -0.07 -0.08 -0.08 -0.09 0.12 0.14* -0.00 * p < 0,05
Für die Patientenstichprobe (Tabelle d2-C.12) sind nur ausgewählte Tests, sowohl in konventioneller Durchführung als auch als Verfahren aus dem Hogrefe Testsystem, deren Beschreibung in dem entsprechenden Handbuch zum Testsystem zu finden ist, dargestellt. Von den konventionell durchgeführten Tests wurden für diese Darstellung ausgewählt: die beiden Grobscreeningverfahren Mini Mental Status Test (MMST: Folstein, Folstein & McHugh 1990; höhere Werte bedeuten geringe Auffälligkeiten), der Syndrom-Kurztest (SKT: Erzigkeit 1989; hohe Fehlerpunkte bedeuten größere Auffälligkeiten), der Benton- oder Visual Retention Test (Benton 1990; Zeichenform, unmittelbare Reproduktion), die Untertests Mosaik-Test und Zahlen-Nachsprechen des HAWIE (Wechsler 1964), die Standard Progressive Matrizes von Raven (1956), der Trail Making Test (TMT: Reitan 1958) sowie der Hooper Visual Organization Test (VOT: Western Psychological Services 1983).
Tab. d2-C.12 (folgende Seite): Rangkorrelationskoeffizienten zwischen Testwerten des d2-C und anderen Verfahren für die Patienten. In der Anordnung sind die konventionell durchgeführten Tests vorangestellt.
N GZ GZ-F GZ-2F KL F F% SB Mini Mental Status Test, Punktwert 209 0.62* 0.62* 0.62* 0.62* -0.29* -0.45* 0.17* Syndrom-Kurztest, Fehlerpunkte 208 -0.67* -0.67* -0.66* -0.66* 0.09 0.31* -0.17* Benton, Zeichenform C, Richtige 69 0.69* 0.71* 0.72* 0.73* -0.40* -0.55* -0.05 Benton-Test, Zeichenform C, Fehler 69 -0.71* -0.74* -0.75* -0.75* 0.42* 0.58* 0.06 Mosaik-Test des HAWIE, Rohwert 188 0.77* 0.78* 0.79* 0.78* -0.40* -0.59* 0.08 Zahlen-Nachsprechen HAWIE 113 0.21* 0.20* 0.19* 0.20* 0.02 -0.11 0.06 Zahlen-Nachsprechen rück. HAWIE 112 0.48* 0.47* 0.46* 0.46* -0.08 -0.25* 0.28* SPM Raven, Rohwert Richtige 62 0.57* 0.60* 0.61* 0.62* -0.49* -0.60* -0.09 Trail Making Test, Zeit TMT-A 24 -0.70* -0.71* -0.70* -0.69* 0.21 0.44* -0.12 Trail Making Test, Zeit TMT-B 24 -0.80* -0.80* -0.80* -0.78* 0.06 0.34 -0.40 Visual Organization Test, Richtige 68 0.49* 0.50* 0.50* 0.51* -0.35* -0.49* 0.15 MWT-A, Richtige 155 0.41* 0.42* 0.43* 0.43* -0.18* -0.28* 0.07 WST, Richtige 52 0.48* 0.48* 0.48* 0.47* -0.13 -0.22 -0.05 LPS-1/2, Richtige 193 0.64* 0.63* 0.63* 0.63* -0.12 -0.31* 0.19* LPS-3, Richtige im 1. Versuch 213 0.74* 0.76* 0.77* 0.77* -0.46* -0.64* 0.07 LPS-4, Richtige im 1. Versuch 206 0.68* 0.70* 0.72* 0.72* -0.48* -0.64* 0.02 TLT, mittlere Reaktionszeit 214 -0.61* -0.62* -0.62* -0.61* 0.20* 0.36* -0.06 TLT, SD der Reaktionszeit 214 -0.54* -0.56* -0.57* -0.57* 0.32* 0.43* 0.02 SZT, Mengenleistung 1.-3. Serie 214 0.88* 0.89* 0.89* 0.89* -0.32* -0.56* 0.21* SZT, Fehlermenge 1.-3. Serie 214 -0.05 -0.07 -0.09 -0.09 0.28* 0.27* 0.06 SZT, Fehlerprozent 214 -0.26* -0.28* -0.29* -0.30* 0.34* 0.40* 0.02 JZT, mittlere Reaktionszeit 76 -0.84* -0.85* -0.85* -0.84* 0.22 0.44* -0.25* Turm von Hanoi, Zeit 5er-Turm 58 -0.59* -0.61* -0.62* -0.63* 0.39* 0.53* 0.05 Turm von Hanoi, Zugzahl 5er-Turm 58 0.05 0.02 -0.01 -0.02 0.42* 0.42* 0.14 MEMO-Test, Richtige 1. Serie 158 0.50* 0.50* 0.50* 0.50* -0.20* -0.32* 0.10 MEMO-Test, Richtige 1.-5. Serie 158 0.53* 0.53* 0.53* 0.53* -0.22* -0.35* 0.11 MEMO-Test, verzögerte Reprod. 116 0.31* 0.31* 0.30* 0.31* -0.09 -0.19* 0.16 VEG, Richtige 1.-4. Serie 94 0.54* 0.55* 0.55* 0.55* -0.27* -0.39* 0.12 Leistungsbeschwerden (c.I.-Skala) 198 -0.31* -0.30* -0.30* -0.30* 0.03 0.14 -0.15* Depressive Symptome (CRS-D) 59 -0.21 -0.21 -0.20 -0.20 0.14 0.20 -0.12 * p < 0,05
Die höchsten Korrelationen der Mengenparameter wurden wiederum mit den konstruktnahen Parametern Mengenleistung im SZT (rS = 0,88 bzw. 0,89), Reaktionszeit im JZT (rS = -0,84 bzw. -0,85) und Ausführungszeit im TMT-B (rS = -0,80 bzw. -0,78) erzielt, aber auch die Punktzahl im Mosaik-Test des HAWIE, der sehr sensibel auf hirnorganische Leistungsbeeinträchtigungen anspricht, korreliert hoch mit den Mengenparametern des d2-C (rS = 0,77 bis 0,79). Relativ hohe Korrelationen wurden aber auch mit einer Reihe anderer Testwerte erreicht, selbst mit Gedächtnistests und so groben Schätzungen kognitiver Beeinträchtigungen wie Punktwert im MMST oder Fehlerpunkte im SKT. Im Gegensatz zur Gesundenstichprobe erscheint die Genauigkeitsleistung für Patienten aber eher einen interpretierbaren Parameter darzustellen.
Wie sich bei der praktischen Durchführung des Tests immer wieder zeigt, ist für der Interpretation der Leistung im d2-C bei Patienten mit neuropsychologischen Symptomen und Beeinträchtigungen zu berücksichtigen, dass sowohl eine niedrige Leistungsmenge wie auch eine niedrige Genauigkeit durch sehr verschiedenartige Störungen zustande kommen können und die einfache Rückführung schlechter Leistung auf eine beeinträchtigte selektive Aufmerksamkeit nicht möglich ist.
So können alternative Ursachen für eine niedrige Leistung neben einer generellen psychischen Verlangsamung (dann ist beispielsweise auch die psychomotorische Reaktionszeit bei einfachen Anforderungen, die keine Entscheidungsprozesse beanspruchen, herabgesetzt) beispielsweise visuell-räumliche Wahrnehmungsstörungen (erschwerte Differenzierung der Buchstaben b und p und erschwerte Erfassung der Punkteanzahl), visueller Neglect für die linke Raumhälfte (dann werden regelmäßig insbesondere Zielzeichen am Anfang der Zeile übersehen), schwere mnestische Ausfälle (mehrfaches Nachfragen, welche Zeichen zu finden sind; wiederholtes Vergessen der Betätigung der Leertaste am Ende einer Zeile), aber auch Störungen der Handfunktionen sein.
Vergleich Gesunde vs. Patienten: Für die Darstellung der Konstruktvalidität des Verfahrens wurden schließlich die Leistungen Gesunder denen von Patienten gegenübergestellt. Da in der Regel bei Gesunden-Patienten-Vergleichen die Gruppen der Gesunden jünger und gebildeter sind als die Patienten (selbst wenn die Unterschiede statistisch nicht signifikant sind, ist dies für viele Untersuchungen festzustellen), wurde für die vorliegende Analyse eine paarweise Parallelisierung der beiden Gruppen vorgenommen. Aus der Gesamtgruppe der untersuchten Gesunden und Patienten wurden jeweils Paare gleichen Geschlechts, gleichen Alters (Altersabweichungen von maximal 1 Jahr zugelassen) und gleicher Anzahl von Ausbildungsjahren (Abweichungen von maximal 1 Jahr zugelassen) gebildet. Auf diese Art und Weise konnten 97 Gesunden-Patienten-Paare, jeweils 56 männliche und 41 weibliche Probanden, mit einem Durchschnittsalter der beiden Gruppen von jeweils 37,6 Jahren (SD = 13,3) und einer durchschnittlich 13,6 Bildungsjahren (SD = 2,4) gebildet werden.
In Tabelle d2-C.13 sind die Ergebnisse im d2-C für beide Gruppen gegenübergestellt. Zusätzlich zu den Parametern des d2-C sind die Ergebnisse im konstruktnahen Symbol-Zahlen-Test (SZT) sowie im Tempo-Lern-Test (TLT) zur Messung der psychomotorischen Reaktionsgeschwindigkeit dargestellt. Da die meisten Parameter nach visueller Analyse keine approximative Normalverteilung aufweisen, wurde zum Gruppenvergleich einheitlich der U-Test von Mann & Whitney herangezogen, lediglich für die Mengen- bzw. fehlerkorrigierten Mengenparameter des d2-C sind auch die Ergebnisse des t-Tests (jeweils 192 Freiheitsgrade bei Varianzhomogenität zwischen den Gruppen) angegeben. Abbildung d2-C.2 zeigt beispielhaft die Verteilung des Parameters GZ-F für die zwei Gruppen.
Wie aus Tabelle und Abbildung hervorgeht, trennen die Parameter GZ, GZ-F, KL und GZ-2F - bei sehr guter Varianzhomogenität - die beiden Gruppen gut: die Differenz ist jeweils größer als der entsprechende Differenzbetrag. Zugunsten der Rohwerteverteilungen spricht, dass für beide Gruppen die Mediane der fehlerkorrigierten Mengenparameter sehr nahe den Mittelwerten sind. Bei höherer Mengenleistung werden in der Gesundengruppe nur unwesentlich mehr Fehler gemacht. Hinsichtlich der Fehlerprozente gibt es keinen Gruppenunterschied. Die höheren Werte für die Patientengruppe gehen zu Lasten einer größeren Anzahl von extrem hohen F%-Werten.
Ein ähnlicher Unterschied zwischen den Gruppen hinsichtlich der Mengenleistung wird im Symbol-Zahlen-Test ersichtlich, wenngleich die Überlappung etwas größer ausfällt. Auch hier ist die Fehlermenge der Gesunden größer. Gesunde und Patienten unterschieden sich jedoch bereits auf dem Niveau der reinen psychomotorischen Reaktionsgeschwindigkeit einschließlich höherer intraindividueller Variabilität (vgl. dazu auch Sturm 1983), wie aus dem Gruppenvergleich zum TLT hervorgeht.
Tab. d2-C.13: Vergleich der Testleistung zweier strikt parallelisierter Teilgruppen.
Gesunde (N=97) Patienten (N=97) U-Test t-Test Test Variable m SD Median m SD Median (Z) (t) d2 GZ 353.1 82.0 362 260.1 82.3 255 6.95** 7.88** GZ-F 346.0 82.3 346 253.4 83.8 251 6.85** 7.76** KL 148.2 36.4 149 106.6 39.7 108 6.71** 7.61** GZ-2F 338.8 82.9 336 246.6 86.0 249 6.74** 7.60** F 7.18 5.44 6 6.78 7.37 5 1.65+ - F% 2.14 1.69 1.71 3.28 4.49 1.84 0.19 - SB 13.2 4.7 13 9.5 3.5 9 6.47** - SZT Menge 195.1 37.2 196 151.3 51.9 155 5.86** - Fehler 3.56 3.04 3 2.26 2.17 2 3.29* - F% 1.85 1.58 1.38 1.85 2.81 1.08 1.68+ - TLT m (ms) 29.25 4.42 29 35.57 10.78 32 5.03** - s 7.21 2.44 7 9.91 4.83 9 4.62** - ** p < 0,001; * p < 0,01; + p < 0,10
Bearbeitungsdauer
Testform Dauer ca. Itemzahl 0 0.00 min %_NUMBEROFITEMS_% Zeiten sind "Bruttozeiten" von Start bis Ende der Testbearbeitung (z.B. inklusive Instruktion).
Besonderheiten der Computerfassung
Das verwendete Geschwindigkeits-Genauigkeitsdiagramm beruht auf demjenigen des d2 von Brickenkamp (1994). Die Interpretation der Dimensionen und der Quadranten ist durch entsprechende Wortmarken angegeben. Ü-Syndrom (Übersprung-Syndrom) kann dabei auch ein Indiz für nicht instruktionsgemäßes Antwortverhalten sein.
Literaturangaben
Bäumler, G. (1991). Auf dem Weg zur operationalen Definition von Aufmerksamkeit. In J. Janssen, E. Hahn, H. Strang (Hrsg.), Konzentration und Leistung, S. 11-26. Göttingen: Hogrefe.
Belter, O. (1995). Eichung und Validierung der Computerversion des Aufmerksamkeits-Belastungs-Tests (Test d2). Diplomarbeit, Humboldt-Universität zu Berlin, Naturwissenschaftlich-Mathematische Fakultät II, Fachbereich Psychologie.
Benton, A.L. (1990). Der Benton-Test. Handbuch. Deutsche Bearbeitung von Otfried Spreen. 6., unveränderte Auflage. Bern: Huber.
Brickenkamp, R. (1991). Fehlinterpretationen von Testleistungen? Anmerkungen zum Beitrag "Konzentrationsleistung ohne Konzentration?" Diagnostica 37, 52-57.
Brickenkamp, R. (1993). Zur Lösung der Problematik von Gesamttestwerten in Konzentrationstests. Report Psychologie 18, Heft 3, 24-26.
Brickenkamp, R. (1994). Test d2 Aufmerksamkeits-Belastungs-Test. Handanweisung. 8., erweiterte und neu gestaltete Auflage. Göttingen: Hogrefe.
Brickenkamp, R. (2002). Test d2 Aufmerksamkeits-Belastungs-Test. Manual. 9., überarbeitete und neu normierte Auflage. Göttingen: Hogrefe.
Erzigkeit, H. (1989). SKT - Ein Kurztest zur Erfassung von Gedächtnis- und Aufmerksamkeitsstörungen. Manual. Weinheim: Beltz Test.
Fay, E. & Meyer, M. (1991). Ein computergestützter Test zur Erfassung der Konzentrationsfähigkeit: Das Verfahren, seine Vorteile gegenüber "Papier-Bleistift-gestützter" Diagnostik und empirische Ergebnisse. In H. Schuler, U. Funke (Hrsg.), Eignungsdiagnostik in Forschung und Praxis. Band 10, S. 85-88. Stuttgart: Verlag für Angewandte Psychologie.
Fay, E. & Meyer, M. (1993). Bonner Konzentrationstest BKT. Ein computergestütztes Verfahren zur Messung der Konzentrationsfähigkeit. Version 2.OF. Göttingen: Hogrefe.
Folstein, M.F., Folstein, S.E. & McHugh, P.R. (1990). Mini-Mental-Status-Test MMST. Deutschsprachige Fassung: J. Kessler, H. J. Markowitsch, P. Denzler. Weinheim: Beltz.
Keller, I. & Grömminger, O. (1993). Aufmerksamkeit. In D.Y. von Cramon, N. Mai, W. Ziegler (Hrsg.), Neuropsychologische Diagnostik, S. 65-90. Weinheim: VCH.
Merten, T. (1995). Vorläufige Ergebnisse von Eichung, Validierung und Normierung des Aufmerksamkeits-Konzentrationstests d2-Computerversion (d2-C). Unveröffentlichtes Manuskript, Berlin.
Merten, T. & Hänsgen, K.-D. (1994). Konzeption zur Entwicklung einer Computerversion des Aufmerksamkeits-Belastungs-Tests (Test d2) von R. Brickenkamp für das Leistungsdiagnostische Labor (LEILA). Unveröffentlichtes Manuskript. Berlin.
Naglieri, J., & Rojahn, J. (2001). Gender differences in planning, attention, simultaneous, and successive (PASS) cognitive processes and achievement. Journal of Educational Psychology, 93, 430–437.
Oehlschlägel, J. & Moosbrugger, H. (1991). Konzentrationsleistung ohne Konzentration? Zur Schätzung wahrer Leistungswerte im Aufmerksamkeits-Belastungs-Test d2. Diagnostica 27, 42-51.
Oehlschlägel, J. & Moosbrugger, H. (1993). Bagatellisieren oder Abhilfe schaffen? Report Psychologie 18, Heft 3, 20-23.
Posner, M.I. & Boies, S.J. (1971). Components of attention. Psychological Review 78, 391-408.
Prosiegel, M. (1991). Neuropsychologische Störungen und ihre Rehabilitation. Hirnläsionen, Syndrome, Diagnostik, Therapie. München: Pflaum.
Raven, J.C. (1956). Standard Progressive Matrices, Sets A, B, C, D, E. London: Lewis.
Reitan, R.M. (1958). Validity of the Trail Making Test as an indicator of organic brain damage. Perceptual and Motor Skills 8, 271-276.
Ruch, W. & Hehl, F.-J. (1989). Psychometric properties of the German version of the EPQ-R. Poster presented at the 4th meeting of ISSID, Heidelberg, 22. - 25. Juni 1989.
Säring, W. (1988). Aufmerksamkeit. In D. von Cramon, J. Zihl (Hrsg.), Neuropsychologische Rehabilitation. Grundlagen - Diagnostik - Behandlungsverfahren, S. 157-181. Berlin: Springer.
Schwettmann, M. (1995). Der Aufmerksamkeits-Belastungs-Test d2 - Eichung und Validierung der Computerversion und vergleichende Betrachtungen zwischen dieser und der Papier-und-Bleistift-Version. Diplomarbeit, Humboldt-Universität zu Berlin, Naturwissenschaftlich-Mathematische Fakultät II, Fachbereich Psychologie.
Siebert, K. (1995). Der d2 - Aufmerksamkeits-Belastungstest im Vergleich mit Persönlichkeits-, Leistungs-, Zustands- und Selbstbeurteilungsvariablen. Diplomarbeit, Humboldt-Universität zu Berlin, Naturwissenschaftlich-Mathematische Fakultät II, Fachbereich Psychologie.
Spreen, O. & Strauss, E. (1991). A compendium of neuropsychological tests. Administration, norms, and commentary. New York: Oxford University Press.
Sturm, W. (1983). Die neuropsychologische Relevanz einfacher und komplexer Reaktions- und Konzentrationsuntersuchungen bei Hirnkranken unter Berücksichtigung ätiologischer und lokalisatorischer Gesichtspunkte. Dissertation, Universität Trier.
Sturm, W. (1989). Aufmerksamkeitsstörungen. In K. Poeck (Hrsg.), Klinische Neuropsychologie, S. 314-318. Stuttgart: Thieme.
Sturm, W., Hartje, W., Orgaß, B. & Willmes, K. (1994). Effektivität eines computergestützten Trainings von vier Aufmerksamkeitsfunktionen. Zeitschrift für Neuropsychologie, 1, 15-28.
Van Breukelen, G.J.P. & Vlaeyen, J.W.S. (2005). Norming Clinical Questionnaires with multiple regression: the pain cognition list. Psychological Assessment, 17 (3), 336-344.
Wechsler, D. (1964). Die Messung der Intelligenz Erwachsener. Textband zum Hamburg-Wechsler-Intelligenztest für Erwachsene [HAWIE]. 3. Auflage. Bern: Huber.
Western Psychological Services (1983). Hooper Visual Organization Test (VOT). Manual. Los Angeles, Ca.: Western Psychological Services.
Westhoff, K. & Dewald, D. (1990). Effekte der Übung in der Bearbeitung von Konzentrationstests. Diagnostica 36, 1-15.
Wolfram, H., Neumann, J. & Wieczorek, V. (1986). Psychologische Leistungstests in der Neurologie und Psychiatrie. Methoden und Normwerte. Leipzig: Thieme.
Zachary, R.A. & Gorsuch, R.L. (1985). Continuous Norming: Implications for the WAIS-R. Journal of Clinical Psychology, 41 (1), 86-97.
Eine genaue Beschreibung der Verfahren, die ohne gesonderte Literaturangabe genannt wurden und die, sofern nicht anders erwähnt, im Rahmen des Hogrefe TestSystems am Computer bearbeitet wurden, ist in den entsprechenden Handbuch-Bänden des Hogrefe TestSystems zu finden.
Dieser Artikel ist eine redaktionell gekürzte und erweiterte Fassung eines Beitrages von Merten u.a. aus dem Handbuch zu LEILA Leistungsdiagnostisches Labor.