F-Test

Quick Start

Wozu wird der F-Test verwendet?
Der F-Test prüft, ob die Varianzen von zwei Stichproben homogen sind.

SPSS-Menü
Analysieren > Deskriptive Statistiken > Häufigkeiten

SPSS-Syntax
FREQUENCIES VARIABLES=Variable_Gruppe1 Variable_Gruppe2
/FORMAT=NOTABLE
/STATISTICS=VARIANCE MEAN
/ORDER=ANALYSIS.

SPSS-Beispieldatensatz

F-Test.sav (SAV, 1 KB)

1. Einführung


Der F-Test prüft, ob die Varianzen von zwei Stichproben im statistischen Sinne gleich sind, das heisst homogen, und folglich aus derselben Grundgesamtheit stammen. Der F-Test umfasst eine Gruppe statistischer Verfahren, bei denen die Teststatistik F-verteilt ist. Varianzhomogenität ist beispielsweise eine Voraussetzung des t-Tests für unabhängige Stichproben und bei Varianzanalysen (ANOVA). Der F-Test und Varianten davon, wie beispielsweise der Levene-Test, werden verwendet, um diese Voraussetzung zu prüfen.

Die Fragestellung des F-Tests wird oft so verkürzt:
"Unterscheiden sich die Varianzen eines interessierenden Merkmals in zwei unabhängigen Stichproben?"

1.1. Beispiele für mögliche Fragestellungen

  • Unterscheiden sich Physik- und Psychologiestudierende hinsichtlich der Varianz ihres Intelligenzquotienten?
  • Ist der Unterschied bezüglich der Varianz des Preises eines Produktes in zwei Detailhandelsgeschäften zufällig?
  • Unterscheidet sich die Varianz der Dauer der täglichen Internetnutzung (in Stunden) bei jungen und älteren Erwachsenen?

1.2. Voraussetzungen des F-Tests

Die Variable ist intervallskaliert
Die Variable weist in der Grundgesamtheit eine Normalverteilung auf
Die zu vergleichenden Gruppen sind voneinander unabhängig

2. Grundlegende Konzepte

2.1. Beispiel einer Studie


In einer Umfrage wurden je 19 Wirtschafts- und Juraabsolventen nach ihrem Einstiegsgehalt (Jahresgehalt in 1‘000 Franken) befragt. Es soll folgende Frage beantwortet werden: Unterscheiden sich die Varianzen des Einstiegsgehalts von Betriebswirtschafts- und Juraabsolventen?

Der zu analysierende Datensatz kann verschiedene Strukturen aufweisen:

Die erste Möglichkeit ist ein Datensatz – in Abbildung 1 als "Variante 'deskriptive Statistik'" bezeichnet –, der neben der Befragtennummer (ID) die Variablen Jahresgehalt_BWL sowie Jahresgehalt_Jus enthält, die für eine Person das Jahresgehalt enthalten oder einen fehlenden Wert, wenn die Person nicht zur entsprechenden Gruppe gehört. Diese Formatierung bietet sich an, wenn die Berechnung via deskriptive Statistiken erfolgen soll (siehe Kapitel 3.1).

Die zweite Möglichkeit ist ein Datensatz – in Abbildung 1 als "Variante 't-Test'" bezeichnet – der neben der Befragtennummer (ID) eine Variable für die Gruppenzugehörigkeit (Gruppen) und eine für das Einstiegsgehalt (Jahresgehalt) enthält. Diese Formatierung bietet sich an, wenn die Berechnung via t-Test für unabhängige Stichproben erfolgen soll (siehe Kapitel 3.3).

Der Datensatz kann unter Quick Start heruntergeladen werden.

Abbildung 1: Ansicht des SPSS-Datensatzes mit beiden Darstellungsvarianten

2.2. Berechnung der Teststatistik

Berechnen der Teststatistik

Beispieldaten
Abbildung 2: Beispieldaten


Abbildung 2 zeigt die Mittelwerte und Varianzen der abhängigen Variablen Jahresgehalt für die beiden Stichproben. Während die Mittelwerte sich nur geringfügig unterscheiden, ist die Differenz der Varianzen grösser. Bei Juraabsolventen zeigt sich eine geringere Streuung als bei Wirtschaftsabsolventen. Dieser Unterschied soll nun mittels F-Test auf Signifikanz geprüft werden.

Die Teststatistik des F-Tests wird folgendermassen berechnet:

mit

= Varianz der Stichprobe mit der grösseren Varianz
= Varianz der Stichprobe mit der kleineren Varianz
= Freiheitsgrade der Stichprobe mit der grösseren Varianz
= Freiheitsgrade der Stichprobe mit der kleineren Varianz
= Stichprobengrössen


Für das vorliegende Beispiel ergibt dies:

Freiheitsgrad Berechnung


Bei identischen Stichprobenvarianzen beträgt die F-Statistik den Wert 1. Bei F-Werten grösser oder kleiner als 1 unterscheiden sich die beiden Stichprobenvarianzen.



Signifikanz der Teststatistik


Der berechnete Wert muss nun auf Signifikanz geprüft werden. Dazu wird die Teststatistik mit dem kritischen Wert der durch die Freiheitsgrade bestimmten F-Verteilung verglichen. Dies sind im Falle der F-Verteilung zwei Freiheitsgrade: die Freiheitsgrade der Stichprobe mit der grösseren Varianz (auch Zählerfreiheitsgrade genannt, df1 ) und die Freiheitsgrade der Stichprobe mit der kleineren Varianz (auch Nennerfreiheitsgrade genannt, df2 ). Dieser kritische Wert kann Tabellen entnommen werden. Abbildung 3 zeigt einen Ausschnitt einer F-Tabelle, der die kritischen Werte der Signifikanzniveaus .05 und .01 zeigt.

Tabelle mit kritischen F-Werten
Abbildung 3: Ausschnitt einer F-Tabelle mit kritischen Werten für α = .05 & α = .01


Für das vorliegende Beispiel beträgt der kritische Wert 2.27 bei df1 = 15, df2 = 18 und α = .05 (siehe Abbildung 3). Ist der Wert der Teststatistik höher als der kritische Wert, so ist der Unterschied signifikant. Dies ist für das Beispiel nicht der Fall (1.65 < 2.27). Es muss also davon ausgegangen werden, dass sich die Varianzen der Einstiegsgehälter der beiden Absolventengruppen nicht unterscheiden (F(15,18) = 1.65, p = .380, n = 35).

3. Der F-Test mit SPSS

3.1. SPSS-Befehle


Es ist nicht möglich, den F-Test direkt mit SPSS durchzuführen. Entweder werden die Varianzen der beiden Stichproben mit Hilfe deskriptiver Statistiken ermittelt oder es wird ein Umweg über einen t-Test gegangen, wie weiter unten besprochen wird.

SPSS-Befehl via deskriptive Statistiken

 

SPSS-Menü: Analysieren > Deskriptive Statistiken > Häufigkeiten

 

Abbildung 4: Klicksequenz in SPSS

 

Hinweis

  • Unter Statistiken können die Kennwerte angegeben werden, die SPSS ausgeben soll. Zur manuellen Berechnung des F-Tests werden die Varianzen benötigt.


SPSS-Syntax

          FREQUENCIES VARIABLES=Jahresgehalt_BWL Jahresgehalt_Jus
          /FORMAT=NOTABLE
          /STATISTICS=VARIANCE MEAN
          /ORDER=ANALYSIS.

SPSS-Befehl via t-Test für unabhängige Stichproben


Wie der entsprechende SPSS-Befehl aufgebaut ist, lässt sich der Seite zum t-Test für unabhängige Stichproben entnehmen.

3.2. Ergebnisse via deskriptive Statistiken


Teststatistik
Abbildung 5: SPSS-Output – Deskriptive Statistiken


Unter Verwendung der Varianzen (Abbildung 5) lassen sich, wie im Unterkapitel Berechnung der Teststatistik beschrieben, der F-Wert und das zugehörige Signifikanzniveau bestimmen.

3.3. Ergebnisse via t-Test für unabhängige Stichproben


Alternativ kann ein t-Test für unabhängige Stichproben verwendet werden, denn dabei wird automatisch der Levene-Test ausgegeben. Dieser stellt eine Variante des F-Tests dar und prüft ebenfalls, ob sich die beiden Stichprobenvarianzen signifikant unterscheiden.

t-Test Ergebnisse
Abbildung 6: SPSS-Output – t-Test für unabhängige Stichproben


Wie Abbildung 6 zeigt, ist der Levene-Test nicht signifikant (p = .380). Dies bestätigt, dass sich die Varianzen der Einstiegsgehälter der beiden Absolventengruppen nicht unterscheiden (Levene-Test: F(1,33) = .792, p = .38, n = 35).

3.4. Eine typische Aussage


Die Varianzen des Einstiegsgehalts von Jura- und Wirtschaftsabsolventen unterscheiden sich nicht signifikant und es kann somit von homogenen Varianzen ausgegangen werden, wie ein Test unter Verwendung der deskriptiven Statistik zeigt (F(15,18) = 1.65,
p = .380, n = 35) respektive ein Levene-Test via t-Test zeigt (F(1,33) = .792, p = .380, n = 35).