CS代写 Testen von Hypothesen

Testen von Hypothesen
12. Testen von Hypothesen
Prof. Burgard (FU Berlin) Schließende Se 21/22 1 / 63

Copyright By PowCoder代写 加微信 powcoder

Testen von Hypothesen
Übersicht
12 Testen von der – – Stichproben
Prof. Burgard (FU Berlin) Schließende Se 21/22 2 / 63

Testen von der Testtheorie
Übersicht
12 Testen von der – – Stichproben
Prof. Burgard (FU Berlin) Schließende Se 21/22 3 / 63

Testen von der : Zulieferbetrieb
In einem kleineren Zulieferbetrieb wird ein spezielles Autoteil in Serie gefertigt. Da bei der Fertigung ein komplizierter Press- und Ziehvorgang stattfindet, sind von den gefertigten Teilen 30% Ausschuss. weisen Haarrisse und andere Materialfehler auf.
Der zuständige Meister will den Ausschussanteil durch Verwendung eines höherwertigen Bleches reduzieren.
Eine Probe von 20 aus einem solchen Blech gefertigten Teilen ergab 2 Ausschussstücke. Reicht dieses Ergebnis, um die Verwendung des höherwertigen Bleches (unter dem Ausschussgesichtspunkt) zu empfehlen oder zumindest eine umfangreichere Versuchsserie durchzuführen?
Prof. Burgard (FU Berlin) Schließende Se 21/22 4 / 63

Testen von der und Alternative: einseitig
Hypothese und Alternative zerlegen die Menge der möglichen Parameterwerte in zwei disjunkte Teilmengen.
: θ = p ∈ (0, 1) Hypothese: H : θ ≥ 0.3
Alternative: A : θ < 0.3 : („einseitige Hypothese“) H:θ≥θ0 A:θ<θ0 bzw. H:θ≤θ0 A:θ>θ0
Prof. Burgard (FU Berlin) Schließende Se 21/22 5 / 63

Testen von der und Alternative: zweiseitig
In bestimmten Situationen hat man es mit zweiseitigen Alternativen zu tun:
Situation Qualitätskontrolle. Es wird ein neues Material eingesetzt, von dem man nicht weiß, ob es besser oder schlechter ist als das bisher benutzte Material.
Fragestellung: Unterscheidet sich die Ausschussrate θ überhaupt von θ0 (=Wert für bekanntes Material)?
(„zweiseitige Hypothese“)
H : θ=θ0 A : θ̸=θ0
Prof. Burgard (FU Berlin) Schließende Se 21/22 6 / 63

Testen von der e für zu prüfende Hypothesen
– Das Management eines Unternehmens möchte wissen, ob die Restrukturierung der für Reklamationen zuständigen Abteilung zu einer Verkürzung der Bearbeitungszeiten bei Reklamationen geführt hat.
– hat für einen Kunden eine TV-Kampagne schalten lassen. Es soll geprüft werden, ob die geplante Anzahl von Kontakten erreicht wurde.
– Ein Professor möchte überprüfen, ob eine Veränderung des Veranstaltungskonzepts bei den Studierenden auf positive Resonanz stößt.
– Nach der Ernennung einer Kanzlerkandidatin will eine Partei wissen, ob sie in der Gunst der Wähler zulegen konnte.
Prof. Burgard (FU Berlin) Schließende Se 21/22 7 / 63

Testen von der 1. und 2. Art
Ein statistischer Test trifft eine Entscheidung für H oder für A. Dabei können folgende Fehler auftreten:
H trifft zu A trifft zu
richtige 2. Art (β − Fehler)
Fehler 1. Art (α − Fehler)
richtige Entscheidung
Übliche Werte für α: 0.01, 0.05, 0.10
Man bezeichnet α auch als Signifikanzniveau des Tests.
Begründung für asymmetrische Behandlung:
Konsequenzen des Fehlers 1. Art schwerwiegender als beim Fehler 2. Art.
Hinweis: Die Alternative wird auch Gegenhypothese genannt. Üblich sind auch die Abkürzungen H0 für die Hypothese („Nullhypothese“) und H1 für die Alternative.
Prof. Burgard (FU Berlin) Schließende Se 21/22 8 / 63

Testen von der : Zulieferbetrieb (Cont’d)
Fehler 1. Art: Man entscheidet sich für die Alternative („neues Verfahren ist besser“), obwohl in der Realität das alte Verfahren mindestens genau so gut ist. ⇒ Die Produktion wird auf das teure Verfahren umgestellt, obwohl dieses keine Vorteile bringt!
Fehler 2. Art: Man lehnt die Alternative („neues Verfahren ist besser“) ab und geht fälschlicherweise davon aus, dass die Umstellung keine Vorteile in Bezug auf den Ausschussanteil bringen würde. ⇒ Die 20 beim Versuch verschlissenen Teile werden abgeschrieben.
Die Wahrscheinlichkeit für den Fehler 1. Art wird vorab festgelegt, der Fehler 2. Art ist nicht genau bekannt und kann bei einzelnen Tests hohe Werte annehmen.
Prof. Burgard (FU Berlin) Schließende Se 21/22 9 / 63

Testen von der
Hypothese und Alternative sind so zu formulieren, dass die Konsequenzen des Fehlers 2. Art „weniger schlimm“ sind als die des Fehlers 1. Art.
Wird bei einem Test die Hypothese nicht abgelehnt, wird das Ergebnis vorsichtig formuliert, weil man die Größe des Fehlers 2. Art nicht kennt:
Statt: „Die Hypothese ist richtig“ mit der Folgerung „Die Alternative ist daher abzulehnen“,
sagt man: „Die Hypothese kann nicht abgelehnt werden.“ Dies hat nicht die Implikation, dass die Alternative abzulehnen ist.
Prof. Burgard (FU Berlin) Schließende Se 21/22 10 / 63

Testen von der : Formulierung
Häufig ist das Forschungsinteresse auf die Bestätigung eines Effekts gerichtet, z.B. der Erwartungswert μ der Differenz zweier Zufallsgrößen X1 und X2 ist von 0 verschieden (X1= Merkmalswerte ohne Behandlung; X2= Merkmalswerte mit Behandlung).
In diesem Fall lautet die („Null“-)Hypothese μ = 0, also „kein Effekt“. „Die Null-Hypothese kann nicht verworfen werden“ bedeutet dann nicht, dass kein Effekt vorhanden ist, sondern nur, dass mit den vorliegenden Beobachtungen kein Effekt sicher nachgewiesen werden kann. Die Konsequenz kann z.B. sein, die Anzahl der Beobachtungen zu vergrößern.
Prof. Burgard (FU Berlin) Schließende Se 21/22 11 / 63

Testen von der und kritischer Teststatistik T ist eine Stichprobenfunktion, dessen Ausprägung zur Testentscheidung führt. Dazu wird ein „kritischer Bereichs“ K (auch als „Ablehnungsbereich“ bezeichnet) und ein „Annahmebereichs“ K ̄ festgelegt.
T ∈ K ⇒ Hypothese ablehnen T ∈ K ̄ ⇒ Hypothese annehmen
bzw. nicht verwerfen
Die Werte, die diese Bereiche voneinander trennen, heißen kritische Werte.
Bemerkung: Ein Test möchte gerade zufällige Schwankungen der Teststatistik erkennen und erst zu einer Ablehnung führen, wenn die Teststatistik signifikant abweicht.
Prof. Burgard (FU Berlin) Schließende Se 21/22 12 / 63

Testen von der Bereich (einseitig)
H:μ≤100 (T=X ̄1−X ̄2) Verteilung der Teststatistik über H (1−seitig)
85 90 95 100 105 110 115 t
Prof. Burgard (FU Berlin) Schließende Se 21/22 13 / 63
0.00 0.02 0.04 0.06 0.08 0.10 0.12

Testen von der Bereich (zweiseitig)
H:μ=100 (T=X ̄1−X ̄2) Verteilung der Teststatistik über H (2−seitig)
85 90 95 100 105 110 115 t
Prof. Burgard (FU Berlin) Schließende Se 21/22 14 / 63
0.00 0.02 0.04 0.06 0.08 0.10 0.12

Testen von der Testtheorie
Überlegungen zur Festlegung des kritischen ̈r θ ∈ H gibt P(T ∈ K|θ) den Fehler 1. Art an. Ein statistischer Test sollte ein vorgegebenes Fehlerniveau α einhalten:
P(T∈K|θ)≤α für θ∈H
Für θ ∈ A gibt P(T ∈ K|θ) die Wahrscheinlichkeit an, die richtige Entscheidung zu treffen. Hier sollte diese Wahrscheinlichkeit möglichst groß sein, um den Fehler 2. Art zu minimieren.
Prof. Burgard (FU Berlin) Schließende Se 21/22 15 / 63

Testen von der von einseitigen Tests
1) Je eindeutiger θ in dem durch H oder A definierten Bereich liegt, desto besser werden die Testaussagen.
2) Je kleiner α (=Fehler 1. Art), umso größer ist in der Regel der Fehler 2. Art (trade-off!).
3) Je größer n, desto genauer die Testaussage.
Prof. Burgard (FU Berlin) Schließende Se 21/22 16 / 63

Testen von der von zweiseitigen Tests
1) Je weiter θ (= μ) von θ0 (= μ0) entfernt ist, desto größer ist die Wahrscheinlichkeit, die Differenz θ − θ0 aufzudecken.
2) Auch hier: Je kleiner α (= Fehler 1. Art), desto größer ist in der Regel der Fehler 2. Art.
3) Je größer n, desto größer die Wahrscheinlichkeit, dass Differenzen θ − θ0 aufgedeckt werden.
Prof. Burgard (FU Berlin) Schließende Se 21/22 17 / 63

Testen von Konstruktionsprinzip
Übersicht
12 Testen von der – – Stichproben
Prof. Burgard (FU Berlin) Schließende Se 21/22 18 / 63

Testen von Testproblem wird immer gleich gelöst:
0) Feststellen eines geeigneten Modells für die Stichprobenwerte Xi
1) Formulierung der (Null-)Hypothese und der Alternative sowie Wahl eines Signifikanzniveaus
2) Festlegung einer geeigneten Teststatisik T
3) Bestimmung der Verteilung von T unter der Null-Hypothese
4) Bestimmung des kritischen Bereichs, in dem H abzulehnen ist
5) von T und Entscheidung mit Interpretation
Prof. Burgard (FU Berlin) Schließende Se 21/22 19 / 63

Testen von -Stichprobentests
Übersicht
12 Testen von der – – Stichproben
Prof. Burgard (FU Berlin) Schließende Se 21/22 20 / 63

Testen von – – vs. Zwei-Stichprobentests
• Ein-Stichprobentests: Beobachtungen stammen aus einer Verteilung. Es sollen Aussagen über die Parameter dieser Verteilung gemacht werden.
• Zwei-Stichprobentests (nächste Abschnitte): Beobachtungen stammen aus zwei Verteilungen. Es sollen Aussagen über die Gleichheit der Parameter, nicht jedoch über ihren Wert gemacht werden.
Prof. Burgard (FU Berlin) Schließende Se 21/22 21 / 63

Testen von -Stichprobentests
Gauss-Test
Test auf μ bei Normalverteilung, σ2 bekannt (d.h. Prüfgröße hat Normalverteilung): Gauss-Test
Da die Annahme „σ2 bekannt“ unrealistisch ist, wird dieser Fall nicht weiter behandelt.
Prof. Burgard (FU Berlin) Schließende Se 21/22 22 / 63

Testen von -Stichprobentests
Test auf μ bei Normalverteilung, σ2 unbekannt: (Ein-Stichproben-)t-Test Das allgemeine Konstruktionsprinzip liefert die t-verteilte Testgröße:
X ̄ − μ 0 T = σˆ / √ n
hat man beispielsweise die Hypothese:
H : μ ≤ μ0 A : μ > μ0
so ist der kritische Bereich:
K = {T > tn−1,1−α} d.h. H ablehnen, wenn T zu groß wird
(=wenn X ̄ hinreichend größer als μ0 ist.)
Prof. Burgard (FU Berlin) Schließende Se 21/22 23 / 63

Testen von – stichproben-t-Test auf μ (σ unbekannt): Übersicht
Xi ∼ N(μ,σ2), i = 1,…,n, σ unbekannt
Hypothesen:
a)H: μ=μ0 gegenA: μ̸=μ0 b)H: μ≤μ0 gegenA: μ>μ0 c)H: μ≥μ0 gegenA: μ<μ0 Teststatistik T = X ̄ − μ 0 √ Verteilung unter H: Testentscheidung H ablehnen, wenn a) |T| > tn−1,1−α2 b) T > tn−1,1−α c) T < −tn−1,1−α Prof. Burgard (FU Berlin) Schließende Se 21/22 24 / 63 Testen von - : : Ein kleiner Supermarkt bezieht Brötchen zum Weiterverkauf von einem Bäcker. -Inhaber will ein durchschnittliches Mindestgewicht von 50g bei angelieferten Brötchen sichern. Sei X das Gewicht eines Brötchens. Man geht davon aus, dass X i.i.d. N(μ,σ2) ist. Stichprobe: 25 Brötchen mit x ̄ = 49.5 und s = 1.2. Test: siehe oben Fall c) H:μ≥50 , A:μ<50 , α=0.01! T = 49.5−50 = −2.083 1.2 K = {T < −t24;0.99} = {T < −2.492} Entscheidung: Die Hypothese kann zu α=0.01 nicht verworfen werden. Prof. Burgard (FU Berlin) Schließende Se 21/22 25 / 63 Testen von -Stichprobentests p- empirische Niveau eines Tests: Der p-Wert: Angabe des Testniveaus, bei dem der kritische Wert gerade mit dem beobachteten = t der Testgröße übereinstimmt. Statistik-Programme weisen stets den p-Wert aus und überlassen die Entscheidung über Nicht-Ablehnung bzw. Ablehung der Hypothese dem Nutzer. Allgemein: kleine p-Werte ⇒ große p-Werte ⇒ Ablehnung der wird nicht abge- lehnt Prof. Burgard (FU Berlin) Schließende Se 21/22 Testen von - mit p- weisen oft nur den p-Wert für den 2-seitigen Test aus: 1. Test 2-seitig H:θ=θ0 , A:θ̸=θ0 θ0 und α vorgegeben Programm liefert 2-seitigen p-Wert: p > α: H nicht ablehnen
p ≤ α: H ablehnen
Prof. Burgard (FU Berlin) Schließende Se 21/22 27 / 63

Testen von – mit p-Werten (Cont’d)
2. Test 1-seitig
z.B.H:θ≥θ0 , A:θ<θ0 θ0 und α vorgegeben Programm liefert 2-seitigen p-Wert: Schätze erst θˆ. a)θˆliegtaufderSeitevonA→p∗ =p/2 b)θˆliegtaufderSeitevonH→p∗ =1−p/2 Dann wieder: p∗ > α: H nicht ablehnen p∗ ≤ α: H ablehnen
Prof. Burgard (FU Berlin) Schließende Se 21/22 28 / 63

Testen von -Stichprobentests
t-Test im RStudio
t.test(X, mu, alternative, conf.level)
• X ist Vektor der Daten
• mu ist θ0 (Voreinstellung 0)
• alternative gibt an, ob zweiseitig (“two.sided“) oder einseitig (“less“, “greater“) getestet werden soll (Voreinstellung
“ two.sided“)
• conf.level ist das Konfidenzlevel, also 1 − α (Voreinstellung 0.95)
Prof. Burgard (FU Berlin) Schließende Se 21/22 29 / 63

Testen von -Stichprobentests
t-Test im RStudio: Beispiel
Test, ob IQ kleiner als 100 ist zum Signifikanzniveau 1%
# Daten einlesen
IQ <- read.csv2("IQ.csv") t.test(IQ, mu=100, alternative="less", conf.level=0.99) One Sample t-test t = -16.5593, df = 1303, p-value < 2.2e-16 alternative hypothesis: true mean is less than 100 99 percent confidence interval: -Inf 86.49306 sample estimates: mean of x 84.28221 Prof. Burgard (FU Berlin) Schließende Se 21/22 30 / 63 Testen von -Stichprobentests Test auf eine Wahrscheinlichkeit p: p-Test Allgemeines Konstruktionsprinzip: -Schätzerfürp:pˆ=X ̄ (X∼B(1,p)) - unter der Hypothese: p = p0 σ pˆ = 􏰜 1 p 0 ( 1 − p 0 ) - Testgröße: (n ≥ 100, np0(1 − p0) > 5) pˆ − p 0
T = 􏰜p0(1−p0) n
∼: N ( 0 , 1 )
Prof. Burgard
(FU Berlin) Schließende Se 21/22 31 / 63

Testen von -Stichprobentests
Test auf eine Wahrscheinlichkeit p: Übersicht
Xi ∼B(1,p),i=1,…,n
Hypothesen:
a)H: p=p0 gegenA: p̸=p0 b)H: p≤p0 gegenA: p>p0 c)H: p≥p0 gegenA: p z1− α2 b) T > z1−α c) T < −z1−α Im RStudio: prop.test(sum(X==1), length(X), p, alternative, conf.level) X muss ein Vektor mit 0-1-Beobachtungen sein. Prof. Burgard (FU Berlin) Schließende Se 21/22 32 / 63 Testen von - : Wahlen Die Partei XY hat für die Bundestagswahl die Devise „8+“ (will heißen: 8% oder mehr) ausgegeben. vor der Wahl soll überprüft werden, ob das Ziel zu erreichen ist. Da der Fall, bei dem man von p > 0.08 ausgeht, obwohl tatsächlich p ≤ 0.08 der Realität entspricht, das Worst-Case-Szenario darstellt, wird die Hypothese wie folgt aufgestellt:
H: p≤0.08vs.A: p>0.08
Die Entscheidung soll zum Signifikanzniveau α = 0.05 getroffen werden. von 200 zufällig ausgewählten Wahlberechtigten hat
pˆ = 0.109 ergeben.
pˆ − p0 1p0(1−p0)
0.109 − 0.08
1 0.08(1−0.08)
Wegen 1.512 < z0.95 = 1.645 kann die Hypothese nicht abgelehnt werden! Prof. Burgard (FU Berlin) Schließende Se 21/22 33 / 63 Testen von -Stichprobentests Übung: Hersteller eines Medikaments hat in einer Untersuchung an n = 1000 Testpersonen festgestellt, dass bei x = 7 Personen unangenehme Hautirritationen als Nebenwirkung der Behandlung aufgetreten sind. Um diese Nebenwirkung im Beipackzettel noch als „selten“ auftretend klassifizieren zu dürfen, muss nachgewiesen werden, dass sie bei weniger als einem Prozent der Anwender auftritt. a) Wie ist X verteilt? b) Wie sollte der Hersteller die Hypothese formulieren, wenn er seriös arbeitet und auf „Nummer sicher“ gehen will. c) den Datensatz aus der .csv. die in b) formulierte Hypothese mit einem geeigneten Test zum Signifikanzniveau α=0.05. Prof. Burgard (FU Berlin) Schließende Se 21/22 34 / 63 Testen von -Stichprobentests Übersicht 12 Testen von der - - Stichproben Prof. Burgard (FU Berlin) Schließende Se 21/22 35 / 63 Testen von - : 2 : Problemstellung: Hypothese: H : μx = μy Alternative: A : μx ̸= μy (bzw. σx2 = σy2) (bzw. σx2 ̸= σy2) X1,...,Xn i.i.d. mit Xi ∼ Fμx,σx2 Y1,...,Ym i.i.d. mit Yi ∼ Gμy,σy2 Es soll z.B. entschieden werden, ob die Parameter μx und μy bzw. σx2 und σy2 gleich oder verschieden voneinander sind. Prof. Burgard (FU Berlin) Schließende Se 21/22 36 / 63 Testen von - von μx und μy bei Normalverteilung i) σx2 = σy2 = σ2 (Varianzhomogenität) ii) σx2 ̸= σy2 (Varianzheterogenität) Fall i) Schätzung von σ2 􏰃σˆx2 ≈ σˆy2 !􏰄 1 􏰃(n−1)σˆx2 +(m−1)σˆy2􏰄 n+m−2 („gepoolte Varianz“) T = 􏰜 ∼tn+m−2 σˆ 2 ( n1 + m1 ) (2-seitig): K = {T < tn+m−2,α2 􏰢 􏰡􏰠 􏰣 } ∪ {T > tn+m−2,1−α2 }
Prof. Burgard (FU Berlin) Schließende Se 21/22 37 / 63
=−tn+m−2,1− α2

Testen von – -Stichproben-t-Test
Xi ∼N(μX,σX2),Yj ∼N(μY,σY2),unabhängig i = 1,…,n, j = 1,…,m, σX2 = σY2
Hypothesen:
a)H: μX =μY gegenA: μX ̸=μY b)H: μX ≤μY gegenA: μX >μY c)H: μX ≥μY gegenA: μX <μY Teststatistik (n−1)σˆ 2 +(m−1)σˆ 2 X Y Verteilung unter H: T ∼ tn+m−2 Testentscheidung H ablehnen, wenn a) |T | > tn+m−2,1− α2 b) T > tn+m−2,1−α c) T < −tn+m−2,1−α Im RStudio: t.test( X , Y, alternative, conf.level, var.equal=TRUE) Prof. Burgard (FU Berlin) Schließende Se 21/22 38 / 63 Testen von - von μx und μy bei Normalverteilung (Cont’d) Fall ii) (Welch 1938): Unter μx = μy gilt: T = 􏰜 σˆ x2 + σˆ y2 ∼: t ν ( 1 + R ) 2 m σˆ x2 wobei ν= R2 + 1 mit R=nσˆy2 (n−1) (m−1) Bemerkung: Bei niedrigen Stichprobenumfängen wird man in der Regel die Hypothese σx2 = σy2 nicht verwerfen, so dass der Welch-Test selten zur Anwendung kommt. Prof. Burgard (FU Berlin) Schließende Se 21/22 39 / 63 Testen von - -Test: Übersicht Xi ∼N(μX,σX2),Yj ∼N(μY,σY2),unabhängig i = 1,...,n, j = 1,...,m, σX2 ̸= σY2 Hypothesen: a)H: μX =μY gegenA: μX ̸=μY b)H: μX ≤μY gegenA: μX >μY c)H: μX ≥μY gegenA: μX <μY Teststatistik T= X ̄−Y ̄ 程序代写 CS代考 加微信: powcoder QQ: 1823890830 Email: powcoder@163.com