Die Varianz ist eine Kennzahl aus dem Bereich der Statistik. Sie ist ein Maß für die Streuung der Werte x eines Datensatzes bzw. einer Zufallsvariablen um ihren Mittelwert.
Es gibt zwei verschiedene Arten die Varianz zu berechnen. :
Bei der ersten Variante wird die Varianz auf die Stichprobe der Zufallsvariablen bezogen. Sie berechnet sich zu:
Bei der zweiten Variante wird die Varianz auf die Grundgesamtheit aller Werte der Zufallsvariablen bezogen. Sie berechnet sich dann zu:
Für eine große Anzahl n der Daten ist der Unterschied zwischen den beiden Varianten vernachlässigbar.
Ist der Datensatz bereits nach den Merkmalsausprägungen gruppiert, kann mit der absoluten Häufigkeit h bzw. der relativen Häufigkeit f gerechnet werden. Dann gilt:
Die Quadratwurzel der Varianz ist die Standardabweichung.