Logo Ingenieurbuero Haberland Hypothesentest

 Home

 Netzplanung

     

Hierarchische Netze

     

Nichthierarchische Netze

     

Verkehrslenkung

 Verkehrstheorie

     

Verkehrsgüte

     

Bündeldimensionierung

 Statistik

     

Parameterstatistik

     

Hypothesentests

 QoS-Parameter

     

QoS-Definitionen

 Wir über uns

 Referenzen

Kontakt:  Mail: webmaster@ingenieurbuero-haberland.de

Stand: 28.10.2003
Erstellt: F. Haberland

 

Hypothesentest

Signifikanztest  Prüfplan  Alternativtest  Operationscharakteristik  Parametertest  sequentieller Test  gestutzter sequentieller Test

Ein Hypothesentest liefert die Entscheidungsaussage ja/nein über die Einhaltung eines geforderten Merkmals einer Lieferung (Abnahmetest). Solche Merkmale können auch Verkehrsgüte- oder Dienstgüte-Parameter sein. Hier werden Signifikanztests und auf Prüfplänen basierende Hypothesentests unterschieden.

Signifikanztest

Es soll geprüft werden, ob der Mittelwert m der Grundgesamtheit dem Sollwert m0 entspricht. Die Fragestellung eines (einseitigen) Signifikanztests lautet:
Ist die Abweichung vom Sollwert m0
Signifikanztest Abweichung vom Sollwert
signifikant oder nicht?

Die Entscheidung lautet

 

Hypothese

H0 : m = m0

annehmen,

wenn Abweichung nicht signifikant,

 

Hypothese

H0 : m = m0

ablehnen,

wenn Abweichung signifikant.

Mit der standardisierten Testgröße bei Annahme bekannter Streuung(!)
Signifikanztest z normiert
wird die Annahmegrenze z0 bei vorgegebendem Signifikanzniveau 1 - alpha (alpha Irrtumswahrscheinlichkeit) so bestimmt, dass
Signifikanztest z kleiner z0 .

Die Abweichung gilt als nicht signifikant, wenn z < z0 ist.

Bei (ggf. asymptotisch) normalverteiltem z ist das zugehörige Quantil aus
Signifikanztest z null
leicht zu berechnen. Dabei ist Zeinsminusalpha das (1 - alpha )-Quantil der normierten Normalverteilung.

Dann lautet die Entscheidung bei

 

zmesskl

:

H0 : m = m0

annehmen

 

zmessgr

:

H0 : m = m0

ablehnen.

Bei Annahme liegt m0 mit der Wahrscheinlichkeit 1 - alpha im Bereich (Konfidenzintervall)
Signifikanztest konfidenzintervall .

nach oben

Der Stichprobenumfang ist zunächst beliebig. Wird jedoch eine gewünschte Konfidenzbreite d0 vorgegeben, kann der notwendige Stichprobenumfang als
Signifikanztest Stichprobenumfang
berechnet werden.

Die Irrtumswahrscheinlichkeit (Risiko) alpha bedeutet:
Die Hypothese H0 wird in 100alpha % der Anwendungsfälle abgelehnt, obwohl sie richtig ist (Lieferantenrisiko).

Der Signifikanztest liefert keine Aussage, wenn H0 angenommen wird, aber falsch ist (Abnehmerrisiko).

Prüfpläne

Statistische Prüfpläne wurden unter der Fachgebietsbezeichnung "statistische Testtheorie" speziell für Qualitätsprüfungen entwickelt. Sie dienen dazu, vor Beginn einer Qualitätsprüfung die Interessen von Lieferant und Abnehmer miteinander abzustimmen und die Qualitätsprüfung nach strenger Regel und ohne weiteren Interpretationsspielraum durchzuführen.

Auszuführen ist ein Alternativtest:

Der Nullhypothese "Qualität gut" wird eine Alternativhypothese "Qualität schlecht" gegenübergestellt (Verhandlungsergebnis zwischen Lieferant und Abnehmer).

Der Prüfplan legt den Stichprobenumfang (resp. die Messzeit) und eine Annahmezahl fest. Als Ergebnis des Tests auf "Qualität gut" gibt es nur die glasklare Aussage "Ja" oder "Nein".

Herleitung des Prüfplans:

  • Ermittlung des statistischen Modells
  • Festlegen der Trennschärfe d des Tests (Quotient aus den Zahlenwerten von Nullhypothese und Alternativhypothese)
  • Vorgeben von Lieferanten- und Abnehmerrisiko alpha und beta (Verhandlungsergebnis)
  • Berechnung der Operationscharakteristik
  • Berechnung des Stichprobenumfangs und der Annahmezahl

Der erforderliche Stichprobenumfang ist umso größer

  • je kleiner alpha und beta sind
  • je höher die Trennschärfe/Genauigkeit (kleines d) ist.

Bei der Ausführung des Tests gemäß Prüfplan können dann Fehler 1.Art zu Lasten des Lieferanten und Fehler 2.Art zu Lasten des Abnehmers mit genau definierten, weil vorher festgelegten, Wahrscheinlichkeiten auftreten.

Fehler 1.Art:

Die Lieferung wird 100alpha % der Anwendungsfälle abgelehnt, obwohl sie die Qualitätsanforderung erfüllt (Lieferantenrisko).

Fehler 2.Art:

Die Lieferung wird 100beta % der Anwendungsfälle angenommen, obwohl sie die Qualitätsanforderung nicht erfüllt (Abnehmerrisiko).

nach oben

Alternativtest mit Attributprüfung

Modell: Die Grundgesamtheit enthält nur 2 alternative Ereignisse:

 

Ereignis A

mit P(A) = p

"schlecht",

z.B. t>t0,

 

Ereignis ~A

mit P(~A) = 1 - p

"gut",

z.B. t<=t0.

Das Testziel

  • ist die Prüfung der Wahrscheinlichkeit p der alternativen Grundgesamtheit (Lieferung)
  • ist nicht die Prüfung des meßbaren Merkmals, z.B. der Zeit t[s]
  • ist die Prüfung der Eigenschaft von z.B. t, über ("schlecht") oder unter ("gut") einer Schwelle t0[s] zu liegen.

Bei statistischer Unabhängigkeit der Ereignisse kann die Gültigkeit der Binomialverteilung vorausgesetzt werden.

Die Fragestellung eines (einseitigen) Alternativtests mit Attributprüfung lautet:
Wird der vereinbarte Ausschußprozentsatz p = p0 ("Gutgrenze") einer Lieferung überschritten oder nicht?

Die Antwort liefert ein Alternativtest über das Merkmal p

 

H0 : p = p0 ,

p0 = Sollwert ("Gutwert") von p

 

H1 : p = p1 ,

p1 = "Schlechtwert" von p

Für die Trennschärfe d = p1/p0 > 1 sind übliche Werte d = 1,5; 2; 3.

Die Entscheidung wird getroffen mittels einer Stichprobe vom Umfang n mit

 

x =

zufällige Anzahl der schlechten Elemente in der Stichprobe (z.B. Anzahl der Werte t>t0),

 

c =

vorgegebene Annahmezahl.

Die Entscheidung lautet:

 

Annahme H0: p = p0

für x<=c:

Lieferung annehmen,

 

Ablehnung H0 (Annahme H1: p = p1)

für x>c:

Lieferung zurückweisen.

nach oben

Operationscharakteristik des Tests

Der Prüfplan des Tests wird als Annahmekennlinie, Annahmewahrscheinlichkeit oder Operationscharakteristik (OC) bezeichnet.

Die Operationscharakteristik beschreibt die Annahmewahrscheinlichkeit der Lieferung als Funktion von p (Schlechtanteil der Lieferung = Grundgesamtheit) mit n und c der Stichprobe als Parameter.

Die Wahrscheinlichkeit, daß die Stichprobe höchstens c schlechte Elemente enthält, ist aus der Binomialverteilung zu berechnen:

Alternativtest Binomialvert.

Der Prüfplan garantiert mit zwischen Lieferant und Abnehmer vereinbarter Wahrscheinlichkeit

  • Alternativtest 1-Lieferantenrisiko dem Lieferanten, daß Lieferungen mit dem Ausschußanteil Alternativtest p<=p0 als "gut" bewertet und angenommen werden.
    H0: p = p0 richtig mit Wahrscheinlichkeit 1 - alpha , alpha = Lieferantenrisiko
  • Alternativtest 1-Abnehmerrisiko dem Abnehmer, daß Lieferungen mit dem Ausschußanteil Alternativtest p>=p1 als "schlecht" bewertet und zurückgewiesen werden.
    H1: p = p1 richtig mit Wahrscheinlichkeit 1 - beta , beta = Abnehmerrisiko.

Mit den Vorgaben

Alternativtest Lieferantenrisiko Abnehmerrisiko

und den Identitäten L(p = 0) = 1, L(p = 1) = 0

erhält man als Ergebnis:

4 Punkte einer OC,

 

die Bestimmungsgleichung für n und c,

 

L(p) = f(p) aus Binomialverteilung

Alternativtest Operationscharakteristik

nach oben

Parametertest

Bei einem Parametertest wird ein Parameter einer Verteilung geprüft, z.B. der Mittelwert (Prüfung auf meßbares Merkmal).

Angewendet auf Ausfallmodelle wird die Ausfallrate lambda [h-1] oder äquivalent der mittlere Ausfallabstand (MTBF) theta = lambda-1 [h] getestet. Voraussetzung für die Anwendbarkeit des Tests sind statistisch unabhängige Ausfallzeitpunkte und konstante Ausfallrate.

Dann sind die Ausfallzeitpunkte exponentialverteilt mit der Ausfallwahrscheinlichkeit

Parametertest Ausfallwahrscheinlichkeit

Testziel ist die Prüfung des wahren, unbekannten Ausfallabstands theta (Grundgesamtheit).

Dazu werden n Elemente (Stichprobe) vom Zeitpunkt t = 0 an beobachtet.

Die Beobachtung wird beendet,

  • wenn eine vorgegebene Ausfallanzahl r = r* erreicht ist (dann ist die Beobachtungsdauer t zufällig)
  • oder wenn eine vorgegebene Beobachtungsdauer t = t* erreicht ist (dann ist die Ausfallanzahl r zufällig).

T ist die summierte Lebensdauer. Sie ist gleich der Beobachtungsdauer.
Statistisches Modell: Stichprobe mit n = 1 und r-maligem Ersetzen bei Ausfall.

Die Maximum-Likelihood-Schätzung des Ausfallabstandes aus der Beobachtung ist
Parametertest Ausfallabstand

Geprüft wird, ob der vereinbarte Ausfallabstand theta = theta0 ("Gutgrenze") eingehalten wird oder nicht.

Mit einem Alternativtest über den Parameter theta = lambda -1 der Exponentialverteilung

 

H0 : theta = theta0 ,

theta0 = Sollwert ("Gutwert") von theta

 

H1 : theta = theta1,

theta1 = "Schlechtwert" von theta

werden r Ausfälle über der Versuchsdauer T  beobachtet mit

 

c = r* - 1

= Annahmezahl,

 

r*

= vorgegebene Abbruchzahl.

Die Entscheidung lautet:

  • Annahme von H0 : theta = theta0
    für r <= c = r* - 1 Ausfälle in der Prüfzeit tr = T,    Lieferung annehmen
  • Rückweisung von H0 (Ann. H1 : theta = theta1)
    für r >= r* Ausfälle in Prüfzeit tr* < T,    Lieferung zurückzuweisen.

nach oben

Operationscharakteristik des Tests

Die Annahmewahrscheinlichkeit (in der Prüfzeit T treten höchstens c = r*-1 Ausfälle auf) ergibt sich aus der Chiquadratverteilung als Funktion von theta (wahrer, unbekannter Ausfallabstand der Grundgesamtheit) mit der Ausfallanzahl r der Stichprobe als Parameter. Für eine beliebige Schranke  gilt:
Parametertest Annahmewahrscheinlichkeit
wobei
Parametertest Ausfallabstand
und Parametertest Quantil der Chiquadratverteilung das alpha-Quantil der Chiquadratverteilung mit 2r Freiheitsgraden sind.

Die Abbruchzahl r = r* in P(theta ) ist die kleinste ganze Zahl, die bei gegebenen alpha , beta , theta0, theta1 die Bestimmungsungleichung
Parametertest Kriterium Ausfallanzahl
erfüllt, wobei d = theta0/theta1 die vereinbarte Trennschärfe des Tests ist.

Es kommen noch die Bestimmungsgleichungen für die Prüfzeit T aus der Fixierung der beiden Punkte der Operationscharakteristik (theta0, 1 - alpha ) und (theta1, beta) hinzu:

Parametertest Lieferantenrisiko Abnehmerrisiko

nach oben

Zugrunde liegt der Satz von Poisson: Sind die Ausfallabstände eines Prozesses unabhängig identisch exponentialverteilt mit der Ausfallrate lambda , dann hat die Anzahl x der Ausfälle innerhalb eines Zeitintervalls [0, T] eine Poissonverteilung mit dem Parameter lambdaT.

Für diese Poissonverteilung gilt:

Parametertest Poissonverteilung Ausfallabstand

Die beiden Bestimmungsgleichungen bedeuten nun:

Die Summe der Wahrscheinlichkeiten der zulässigen Ausfallzahlen von x = 0 bis x = c (Annahmezahl) muss bei der Hypothese theta0 genau 1 - alpha und bei der Gegenhypothese theta1 mindestens beta betragen.

Der Prüfplan garantiert mit zwischen Lieferant und Abnehmer vereinbarter Wahrscheinlichkeit

  • P(theta ) >= P(theta0) = 1 - alpha dem Lieferanten, daß Lieferungen mit Ausfallabstand theta >= theta0 als "gut" bewertet und angenommen werden:
    H0 : theta = theta0 richtig mit Wahrscheinlichkeit 1 - alpha , alpha = Lieferantenrisiko
  • 1 - P(theta ) >= 1 - P(theta1) = 1 - beta dem Abnehmer, daß Lieferungen mit Ausfallabstand £ theta1 als "schlecht" bewertet und zurückgewiesen werden:
    H1 : theta = theta1 richtig mit Wahrscheinlichkeit 1 - beta, beta = Abnehmerrisiko

Parametertest Operationscharakteristik

nach oben

Sequentieller Parametertest

Ein sequentieller Test ist ein sich selbst (automatisch) beendender Alternativtest. Bei Anwendung auf eine Attributprüfung werden der Grundgesamtheit schrittweise Stichprobenelemente entnommen und anhand der Annahmezahl c auf H0, H1 geprüft.

Der sequentielle Parametertest ist die Anwendung auf eine Parameterprüfung (Ausfallmodell). Dazu wird schrittweise die Prüfdauer erhöht und anhand der Ausfallzahl r auf H0, H1 geprüft.

Der Test wird beendet, wenn die akkumulierte Information für H0 oder H1 ausreicht. Andernfalls wird weitergeprüft.

Vorteil:

  • Mittlere Testdauer bei "richtiger" Wahl von m0, m1 kleiner

Nachteil:

  • Stichprobenumfang (Attributprüfung) bzw. Prüfdauer (Parameterprüfung) unbestimmt (Zufallsvariable)
  • Höherer Stichprobenumfang bzw. Prüfdauer, wenn wahres m in der Nähe von m0,5 liegt (Median, indifferente Qualität)
  • Abhängige Stichprobe problematischer

nach oben

Operationscharakteristik des Tests

Die Operationscharakteristik eines sequentiellen Tests ohne Stutzung ist näherungsweise in parametrischer Darstellung
Sequentieller Parametertest Operationscharakteristik
mit
Sequentieller Parametertest Hypothese
wobei

 

d = theta0/theta1

Trennschärfe

 

h

positive oder negative reelle Zahl einschließlich Null

 

A, B

Konstanten aus den Vorgaben Verteilung und Risiken alpha, beta.

(Details können erfragt werden)

Es gelten immer

Sequentieller Parametertest Lieferantenrisiko Abnehmerrisiko

Mittlere Entscheidungsdauer

Da bei einem sequentiellen Test die notwendige Prüfdauer (Beobachtungsdauer) bis zur Entscheidung eine Zufallsvariable ist, wird der Erwartungswert (Mittelwert) angegeben. Die mittlere Entscheidungsdauer ohne Stutzung ist näherungsweise

Sequentieller Parametertest Entscheidungsdauer

nach oben

Gestutzter sequentieller Parametertest

Der Nachteil hohen Stichprobenumfangs bzw. hoher Prüfdauer bei einem sequentiellen Parametertest ist durch Begrenzung (Stutzung) des Test vermeidbar.

Ein gestutzter sequentieller Parametertest auf den mittleren Ausfallabstand theta = lambda-1 angewendet.

Voraussetzung für die Anwendbarkeit sind wie bei dem Parametertest

  • statistische Unabhängigkeit der Ausfallzeitpunkte
  • konstante Ausfallrate
  • also exponentialverteilte Ausfallzeiten.

Entscheidungsalgorithmus

Entscheidungsgrundlage ist die akkumulierte Summenlebensdauer (Prüfdauer) T = T(r).

Weiter sind

 

r

akkumulierte Ausfallanzahl,

 

h0, h1, s

Konstanten aus Vorgaben zur Verteilung (hier Exponentialverteilung),

 

alpha , beta , theta0, theta1

wie oben.

(Details können erfragt werden)

Wenn r Ausfälle in T(r) auftreten, dann lautet die Entscheidung im Fall

 

T1(r) = - h1 + sr < T(r) < h0 + sr = T0(r):

weiterprüfen,

 

T(r) >= T0(r):

H0 : theta = theta0 annehmen,

Prüfung bei T = T0(r) beenden,

 

T(r) <= T1(r):

H0 zurückweisen (H1 : theta = theta1 annehmen),

Prüfung bei T = T1(r) beenden.

Abbruch (Begrenzung, Stutzung) der Prüfung bei

 

T = Tmax0,

wenn r < rst:

H0 : theta = theta0 annehmen,

 

T = Tmax0,

wenn r >= rst:

H0 zurückweisen (H1 : theta = theta1 annehmen).

Prüftabelle

In der Prüftabelle eines sequentiellen Tests sind schrittweise über der Ausfallzahl r die Werte der Annahmegeraden T0(r) und der Rückweisungsgeraden T1(r) aufgetragen. Entschieden wird anhand dieser Prüftabelle.

Stutzung

Als Stutzungsregel wird häufig rst = r* + 1 verwendet, aber auch rst = 3r* wird benutzt.

    Die Stutzung beeinflußt Operationscharakteristik und mittlere Entscheidungsdauer.

    Der Einfluß nimmt zu, je näher rst an r* liegt.

nach oben