TIMSS

TIMSS 2019 ist der aktuelle Durchgang der größten internationalen Vergleichsstudie zu den mathematischen und naturwissenschaftlichen Leistungen von Schulkindern. TIMSS steht für „Trends in International Mathematics and Science Study“. Der Forschungsbericht zu den Ergebnissen aus Deutschland ist frei zugänglich:
https://www.waxmann.com/index.php?eID=download&buchnr=4319

TIMSS 2019 ist eine computerbasierte Erhebung im Unterschied zu allen TIMSS-Vorgängerstudien, die papierbasiert durchgeführt wurden. Die Autoren heben hervor „dass die in Deutschland getestete Population der Viertklässlerinnen und Viertklässler typischerweise keine Computer oder eher selten Computer im Unterricht nutzt. Dementsprechend dürfte es für viele Kinder ungewohnt sein, Aufgaben im Mathematik- oder Sachunterricht am Computer zu bearbeiten.“ Dieser Umstand und weitere Änderungen gegenüber früheren Durchgängen führen zu Interpretationsproblemen der deutschen Mathematikkomponente von TIMSS 2019. Wir besprechen daher den aktuellen Bericht erst im Anschluss an eine detaillierte Erörterung der letzten papierbasierten Untersuchung TIMSS 2015. Der Bericht zu TIMSS 2015 ist ebenfalls frei verfügbar: 
https://www.waxmann.com/fileadmin/media/zusatztexte/3566Volltext.pdf


Deutsche Schulkinder zeigten laut TIMSS 2015 am Ende der vierten Jahrgangsstufe eine auffällig schwache Leistung in Mathematik, was auch in den Medien Niederschlag fand (siehe z.B. den Spiegel-Artikel „Deutsche Schüler haben ein Mathe-Problem“, URL: http://www.spiegel.de/lebenundlernen/schule/timss-studie-deutsche-grundschueler-haben-ein-mathe-problem-a-1123472.html)

Die schwache Leistung der deutschen Schulkinder in Mathematik (signifikant schlechter als in den Vergleichsländern aus der EU und aus der OECD) ist allerdings allein durch das auffällig schlechte Ergebnis im Inhaltsbereich „Arithmetik“ (Rechnen) bedingt. Dieses schlechte Abschneiden am Ende der 4. Klassen, speziell im Rechnen - nicht in den Inhaltsbereichen „Geometrie/Messen“ oder „Umgang mit Daten“, könnte mit der verdrehten Zahlensprechweise im Deutschen zusammenhängen. Denn deutschsprachige Schulkinder müssen gegen die herkömmliche Sprechweise der Zahlen das Stellenwertsystem erlernen. Aus mathematik-didaktischer Sicht torpediert diese Zahlbenennung im Deutschen eine strukturierte Zahlauffassung.

Somit ergibt sich aus den Ergebnissen von TIMSS unmittelbar die Hypothese („Zwanzigeins-Hypothese“), dass die verdrehte Zahlensprechweise im Deutschen eine nachteilige Auswirkung auf die mathematischen Leistungen der deutschsprachigen Schulkinder hat. Der Verein schlägt daher vor, dass diese Hypothese auch in der Pädagogik mit wissenschaftlichen Methoden empirisch untersucht wird.

Die folgende Aussage von Frau Ekström, die sich auf die weniger spezifische PISA-Studie von 2010 und auf einen allgemeinen Vergleich mit Schweden und Norwegen bezieht, ist aufgrund von TIMSS 2015 zu relativieren: „Weiterhin stelle ich mich sehr skeptisch gegen die Behauptung, dass eine Änderung Erleichterung beim Rechnen bringen würde. Wahrscheinlich beruhen die Leistungen beim Rechnen vielmehr auf die Qualität des Mathematikunterrichts als auf der Sprechweise der Zahlwörter. Die PISA-Ergebnisse zeugen tatsächlich auch davon, dass Deutschland und die Schweiz bessere Mathematikleistungen aufweisen, als Schweden und Norwegen (PISA, 2010:136)“ (siehe: http://su.diva-portal.org/smash/get/diva2:532990/FULLTEXT01). Es ist unstrittig, und auch ein zentrales Ergebnis von TIMSS 2015, dass die mathematischen Leistungen der Schulkinder von vielen Einflussgrößen abhängen. Dies schließt aber die „Zwanzigeins-Hypothese“ nicht aus. Im Gegenteil, diese Hypothese wird durch TIMSS 2015 als eine der vielen möglichen Ursachen für Leistungsunterschiede nahegelegt.

Die AG "Empirische Studien" hat die deutsche TIMSS-Projektleitung am Institut für Schulentwicklungsforschung der TU Dortmund kontaktiert. Gemeinsam wurde im TIMSS-2015-Instrumentarium die spezielle Aufgabe M01_01 („convert words to numerals“) identifiziert, die zum Testen der Zwanzigeins-Hypothese geeignet erschien. Bei dieser Aufgabe wurden die Schulkinder gebeten, eine vierstellige Zahl, die in Worten geschrieben war (z.B. viertausendachtundzwanzig) in eine indisch-arabische Ziffernzahl zu übersetzen; gegeben waren vier Antwortoptionen im Multiple-Choice-Format. Auf Vorschlag von Frau Dr. Wendt, Erstautorin des deutschen TIMSS-2015-Berichts, wurde geprüft, ob sich die Fehlerhäufigkeiten in Deutschland und den fünf an TIMSS teilnehmenden asiatisch-pazifischen Staaten/Städten Singapur, Hong Kong, Korea, Japan und Taiwan entsprechend der Zwanzigeins-Hypothese unterscheiden, denn in diesen asiatisch-pazifischen Staaten/Städten wird stellenwertgerecht gesprochen. Die ermittelten Fehlerhäufigkeiten waren in Übereinstimmung mit der Hypothese: 8,3% vs. 4,0% (Unterschied statistisch signifikant). Weitere Aufgabenstellungen aus TIMSS scheinen nicht spezifisch geeignet, um die Hypothese zu prüfen (Beispiele für derartige spezifische Aufgaben: siehe die Untersuchungen zu Walisisch, Tamil, Chinesisch vs. Englisch). Der intensive Austausch mit Frau Dr. Wendt kann dem folgenden Protokoll zur Besprechung am 28.09.2017 (mit Nachtrag am 12.12.2017) entnommen werden.

Protokoll_Besprechung_28.09.2017_mit update 12.12.2017.pdf

Eine detailliertere Darstellung von TIMSS und der Ergebnisse dieser wichtigsten Studie zur Leistungsfähigkeit von Grundschulkindern in Mathematik im internationalen Vergleich kann den folgenden Texten entnommen werden: 

TIMSS_2015_verdrehte Zahlensprechweise_10Mai2017.pdf

Anhang_TIMSS_2015_verdrehte Zahlensprechweise_10Mai2017.pdf


Der aktuelle Durchgang TIMSS 2019 bestätigt die Befunde von TIMSS 2015. So berichtete der Deutschlandfunk am 08.12.2020:

„Viertklässler kämen im Fach Mathematik nur auf 521 Punkte, heißt es in der internationalen Vergleichsstudie TIMSS. Dies sei deutlich unter dem Mittelwert der anderen teilnehmenden EU-Staaten von 527 Punkten. Jungen und Mädchen aus Staaten der Organisation für wirtschaftliche Zusammenarbeit und Entwicklung erzielten im Schnitt sogar 529 Punkte.“

Grundlage dieser Darstellung sind zwei Tabellen aus TIMSS 2019 (Abb. 3.5, S. 83 und Abb. 3.8, S. 119), aus denen wir die Leistungsmittelwerte und Standardfehler der Leistungsmittelwerte (in Klammern) für Deutschland und geeignete Vergleichsgruppen (VG) für die drei Inhaltsbereiche (Arithmetik, Messen/Geometrie, Daten) und gesamt entnehmen:

                Arithmetik  Messen/Geometrie     Daten         Gesamt

VG OECD      527 (0.5)         529 (0.5)          528 (0.6)       529 (0.5)

VG EU          527 (0.5)         528 (0.6)          522 (0.6)       527 (0.5)

Deutschland   517 (2.1)         531 (2.6)          515 (3.1)       521 (2.3)

Diese schwache Gesamtleistung der deutschen Schulkinder in Mathematik (signifikant schlechter als in den Vergleichsländern aus der EU und aus der OECD) liegt etwas niedriger als vier Jahre zuvor in TIMSS 2015, wo VG OECD = 528 (0.5), VG EU = 527 (0.6) und Deutschland = 522 (2.0). Dieser Rückgang kann nicht durch den Wechsel von papierbasierter zu computerbasierter Erhebung erklärt werden, denn die berichteten Leistungswerte wurden bereits wegen des Moduswechsels nach oben korrigiert: der originäre, also unkorrigierte Gesamtleistungswert der deutschen Schulkinder lag in TIMSS 2019 bei lediglich 509.8 (3.0) (Tabelle 5.2, S. 180).

Wie in TIMSS 2015 ist in TIMSS 2019 die Leistung der deutschen Schulkinder in Arithmetik signifikant schlechter als in den beiden Vergleichsgruppen, was - wie in TIMSS 2015 - die wesentliche Ursache für den schlechten Gesamtwert darstellt. Aber anders als bei TIMSS 2015 ist die niedrige Gesamtleistung in TIMSS 2019 zusätzlich auf eine nun auch schwache Leistung im Bereich „Daten“ zurückzuführen, wo in TIMSS 2015 noch ein Leistungswert von 535 (2.6) erreicht wurde. Die Ursache hierfür kann in einem Wechsel der Anforderungen im Bereich „Daten“ gesehen werden, denn in TIMSS 2015 lagen 17% der gestellten Aufgaben über dem Niveau der curricularen Anforderungen in Deutschland, aber in TIMSS 2019 waren es 28% der Aufgaben, z.B. Auswerten von Kreisdiagrammen und Liniendiagrammen.

Der Moduswechsel von papierbasierter zu computerbasierter Erhebung und die Anhebung der Anforderungen im Bereich „Daten“ führen zu Interpretationsproblemen der Ergebnisse von TIMSS 2019, jedoch kann festgehalten werden, dass die wichtige aus TIMSS 2015 abgeleitete Folgerung aufgrund der schlechten Leistung in Arithmetik unverändert gilt:

Die Ergebnisse von TIMSS korrespondieren mit der Hypothese („Zwanzigeins-Hypothese“), dass die verdrehte Zahlensprechweise im Deutschen eine nachteilige Auswirkung auf die mathematischen Leistungen der deutschsprachigen Schulkinder hat.