Stell Dir vor, Du hast eine ganze Menge an Messdaten zusammengetragen. Angenommen, es sind zwei mal 135 Werte. Welcher Art diese Messwerte sind, sei hier noch unerheblich, konkret wird es mit dem Beispiel im Beitrag.
Mit der Funktion MITTELWERT berechnest Du einen Mittelwert. Die Frage ist nun: Wie repräsentativ ist dieser Mittelwert?
In einem früheren Beitrag habe ich dir eine Methode gezeigt, wie Ausreißer ermittelt werden können. Im Folgenden soll er kurz „Altbeitrag“ genannt werden.
Dieser Beitrag zeigt dir, wie mit der Funktion GESTUTZTMITTEL ebenfalls Ausreißer unberücksichtigt bleiben.
In einem vorangegangenen Beitrag hast du etwas über die Funktion QUANTIL erfahren können. Mit der Excel-Version 2010 kamen zwei neue Funktionen dazu, QUANTIL.INKL und QUANTIL.EXKL.
Dieser Beitrag wird sich diesen Funktionen widmen und die Unterschiede aufzeigen.
Quantile sind Lageparameter einer Beobachtungsreihe. Sie bezeichnen Grenzwerte, wobei ein Teil der Reihe unterhalb und ein Teil oberhalb dieser Grenzwerte liegt.
Lageparameter? Damit bist du im Reich der deskriptiven Statistik angelangt. Dir ist bekannt, dass es in Excel eine Kategorie mit statistischen Funktionen gibt.
Bis einschließlich Excel 2007 gab es nur die Funktion QUANTIL. Ab Excel 2010 findest du zwei neue Ausgestaltungen, die Funktionen QUANTIL.INKL und QUANTIL.EXKL.
Mit der alten Funktion QUANTIL kann dennoch weiter gerechnet werden. Dieser Beitrag beschäftigt sich allein mit ihr.
Ein QUANTIL berechnen
Die Excel-Hilfe führt dazu aus, das die Funktion das Alpha-Quantil einer Gruppe von Daten zurück gibt. Mithilfe der Funktion kannst du einen Akzeptanzschwellenwert festlegen. Du kannst z.B. entscheiden, dass nur Bewerber eingeladen werden, deren Prüfungsergebnisse oberhalb des 85%-Quantils liegen.
Die Syntax lautet:
=QUANTIL(Matrix;k)
Matrix bezeichnet den Datenbereich, den du untersuchen willst. k ist der Alphawert aus einem geschlossenen Intervall zwischen 0 und 1. Beim 30%-Quantil z.B. schreibst du k als „30%“ oder als „0,3“.
Ein Beispiel soll dir die Funktionsweise näher bringen. Angenommen, dir liegen Angaben über den Wasserverbrauch eines Ortes über 15 Monate vor. Diese sind chronologisch, unsortiert, in einer Liste erfasst.
Du willst wissen, welche Werte die unterste und die oberste Toleranzgrenze bilden.
Die unterste Grenze soll durch das 25%-Quantil, die oberste durch das 75%-Quantil abgebildet werden. Zusätzlich errechnest du noch den Median mit der Funktion MEDIAN und als 50%-Quantil.
25%-Quantil =QUANTIL($C$4:$C$18;25%) =303.152,50
50%-Quantil =QUANTIL($C$4:$C$18;50%) =306.994,00
Median =MEDIAN($C$4:$C$18) =306.994,00
75%-Quantil =QUANTIL($C$4:$C$18;75%) =313.950,00
Der Mittelwert liegt übrigens bei =MITTELWERT($C$4:$C$18) =309.168,93 und ist damit größer als der Median.
Mit bedingter Formatierung willst du sichtbar machen, welche Werte zwischen dem 25%- und dem 75%-Quantil liegen. Dazu sortierst du die Liste aufsteigend nach Größe.
Markiere die Liste, gehe auf die Bedingte Formatierung und wähle die Regel „Formel zur Ermittlung der zu formatierenden Zellen verwenden“.
Schreibe die Formel:
=UND(C4>=$F$4;C4<=$F$5)
und formatiere „Ausfüllen“ mit grün.
In der Liste sind nun die sieben Werte zwischen 303.242 und 312.874 farblich markiert. Diese Werte liegen zwischen dem 25%- und dem 75%-Quantil. Vier Werte liegen darunter, vier Werte darüber. Diese Erkenntnisse kannst du z.B. für Planungszwecke verwenden. Das 25%-Quantil kann als Worst Case, das 75%-Quantil als Best Case dienen.