CS代考 Schätzen von Parametern

Schätzen von Parametern
10. Schätzen von Parametern
Prof. Burgard (FU Berlin) Schließende Se 21/22 1 / 39

Copyright By PowCoder代写 加微信 powcoder

Schätzen von Parametern
Übersicht
10 Schätzen von ̈tzfunktionen und ihre von Standardfehlern
Prof. Burgard (FU Berlin) Schließende Se 21/22 2 / 39

Schätzen von
• Kapitel 2 und 3: Ausprägung des interessierenden Merkmals bei allen Einheiten der Grundgesamtheit bekannt (Totalerhebung)
• Ziel der Untersuchung: vorliegende Daten beschreiben (deskriptive Statistik)
• jetzt: Ausprägung des interessierenden Merkmals wird nur für eine zufällig gezogene Subpopulation (Zufallsstichprobe) bestimmt
• Voraussetzung: Verteilung des interessierenden Merkmals in der Grundgesamtheit folgt einem bestimmten statistischen Modell
• Ziel: Parameter dieses Modells aus der Stichprobe schätzen
Prof. Burgard (FU Berlin) Schließende Se 21/22 3 / 39

Schätzen von Vorgehensweise
1) Bestimme den Verteilungstyp der beobachteten Daten (= Formulierung eines statistischen Modells)
2) Bestimme die Parameter des statistischen Modells (= Schätzen von Parametern)
Zunächst behandelt:
• Punktschätzung = Angabe von Schätzwerten
Es folgen:
• Intervallschätzung = Angabe eines Intervalls, in dem der Parameter der theoretischen Verteilung liegt (Kapitel 11)
• Hypothesen über Parameter der theoretischen Verteilung (Kapitel 12) Prof. Burgard (FU Berlin) Schließende Se 21/22 4 / 39

Schätzen von ̈tzfunktionen und ihre Eigenschaften
Übersicht
10 Schätzen von ̈tzfunktionen und ihre von Standardfehlern
Prof. Burgard (FU Berlin) Schließende Se 21/22 5 / 39

Schätzen von ̈tzfunktionen und ihre ̈tzfunktion
, z.B. μ, σ2, p, λ, usw., werden üblicherweise mit dem griechischen Buchstaben θ (sprich: „Theta“) bezeichnet.
Definition (Schätzfunktion)
θˆ(X1, . . . , Xn), deren Wert θˆ(x1, . . . , xn) als Schätzwert für den unbekannten Parameter θ dient, heißt Schätzfunktion (oder kurz: Schätzer) für θ.
Häufig benutzt man die Kurzschreibweise θˆ für θˆ(X1, . . . , Xn) bzw.
θˆ(x1, . . . , xn). zwischen Schätzfunktion und Schätzwert ist dabei aus dem jeweiligen Kontext zu ersehen.
Prof. Burgard (FU Berlin) Schließende Se 21/22 6 / 39

Schätzen von ̈tzfunktionen und ihre

Binomialverteilung
μˆ(X1,…,Xn) = X ̄ σˆ2(X1,…,Xn) = S2
λˆ 1 = X ̄ λˆ 2 = S 2 B(1,p): pˆ=X ̄
Prof. Burgard (FU Berlin) Schließende Se 21/22 7 / 39

Schätzen von ̈tzfunktionen und ihre der Schätzfunktion
Häufig stehen mehrere alternative Schätzfunktionen für denselben Parameter zur Verfügung, so dass das Problem entsteht zu entscheiden, welche der Schätzfunktionen gewählt werden soll.
Schätzfunktionen sind Funktionen von Zufallsvariablen. Somit sind Schätzfunktionen selbst Zufallsvariablen, haben also eine Verteilung, einen Erwartungswert und eine Varianz. wird es darum gehen, diese Eigenschaften zu bestimmen und zu interpretieren.
Prof. Burgard (FU Berlin) Schließende Se 21/22 8 / 39

Schätzen von ̈tzfunktionen und ihre
Die Zufallsvariable X sei Poisson-verteilt mit dem Parameterwert λ = 5.
Wir ziehen mittels Simulation 10 Stichproben vom Umfang n = 20. Die Stichprobenmittelwerte und die empirischen Varianzen sind in einer Tabelle (s. nächste Folie) angegeben.
Bei zwei Stichproben – Nr. 6 und 10 – liegt die empirische Varianz s2 näher beim wahren λ = 5 als das arithmetische Mittel x ̄. Bei den anderen acht Stichproben ist die Situation umgekehrt.
Prof. Burgard (FU Berlin) Schließende Se 21/22 9 / 39

Schätzen von ̈tzfunktionen und ihre (Cont’d)
Realisationen von X ̄ und S2 bei 10 Stichproben: i x ̄ s2
1 5.20 7.66 2 4.90 4.39 3 5.00 4.20 4 4.75 2.69 5 5.60 6.11 6 4.45 4.65 7 4.60 3.94 8 4.85 4.23 9 6.10 9.69
10 4.80 5.06
Wichtig: Nicht die konkrete Realisierung eines Schätzers ist das
Beurteilungskriterium für die Güte eines Schätzers, sondern die Verteilung aller unter dem Modell möglichen Schätzergebnisse.
Prof. Burgard (FU Berlin) Schließende Se 21/22 10 / 39

Schätzen von ̈tzfunktionen und ihre
̈tzer sollte den wahren Parameterwert im Mittel treffen.
Definition (Bias (Verzerrung))
Die erwartete Abweichung des Schätzers vom wahren Wert
b ( θˆ , θ ) = E ( θˆ ) − θ heißt Bias bzw. Verzerrung.
Definition (Erwartungstreue (Unverzerrtheit))
θˆ(X1, . . . , Xn) heißt unverzerrt bzw. erwartungstreu für θ, wenn b(θˆ,θ)=0 d.h. E(θˆ)=θ.
Andernfalls heißt θˆ verzerrt.
Prof. Burgard (FU Berlin) Schließende Se 21/22 11 / 39

Schätzen von ̈tzfunktionen und ihre : Bemerkungen
• Der Bias b(θˆ, θ) = E (θˆ) − θ ist die systematische Abweichung, die eine Schätzfunktion vom zu schätzenden Parameter aufweist.
• In empirischen Arbeiten wird häufig jede Abweichung von θˆ von θ als Verzerrung bezeichnet. ist nicht gerechtfertigt. Abweichungen vom wahren Wert θ können rein zufällig entstehen, obwohl der Schätzer θˆ unverzerrt ist.
Prof. Burgard (FU Berlin) Schließende Se 21/22 12 / 39

Schätzen von ̈tzfunktionen und ihre : ̈tzung von μ unter Normalverteilung:
• Schätzfunktion 1: θˆ = X ̄ = 1 􏰗n X
1 ni=1i • Schätzfunktion 2: θˆ = X ̃ (Median)
• Schätzfunktion 3: θˆ = X1+Xn 32
Sind die Schätzfunktionen erwartungstreu?
Prof. Burgard (FU Berlin) Schließende Se 21/22 13 / 39

Schätzen von ̈tzfunktionen und ihre : Beispiel (Cont’d)
􏰌1 􏰉n 􏰍 = E n Xi
Prof. Burgard
(FU Berlin)
= n1nμ=μ Schließende Se 21/22
= nE 􏰉Xi i=1
⇒ θˆ ist erwartungstreu für den Parameter μ der Normalverteilung!

Schätzen von ̈tzfunktionen und ihre : Beispiel (Cont’d)
E 􏰓 θˆ 􏰔 = E ( X ̃ ) = μ 2
(Symmetrie der Verteilung!)
⇒ θˆ2 ist erwartungstreu für den Parameter μ der Normalverteilung!
ˆ 􏰅X1 +Xn􏰆 E(θ3) = E 2
E(X1)+E(Xn) 2
⇒ θˆ3 ist erwartungstreu für den Parameter μ der Normalverteilung!
: Welcher der drei Schätzer ist der beste?
Prof. Burgard (FU Berlin) Schließende Se 21/22 15 / 39

Schätzen von ̈tzfunktionen und ihre : Übung
Der Parameter p der Binomialverteilung (Xi ∼ B(k, p)) soll geschätzt werden. Prüfen Sie, ob die folgenden vier Schätzfunktionen erwartungstreu für p sind.
Es liegt eine Stichprobe X1,…,Xi,…,Xn vom Umfang n vor.
pˆ 1 = X 1 pˆ2 = X1
X ̄ n1 􏰗 ni = 1 X i
pˆ3=k= k pˆ4 = nX1 + k
Prof. Burgard
(FU Berlin)
Schließende Se 21/22

Schätzen von ̈tzfunktionen und ihre ̈tzer, deren Erwartungwert mit wachsendem n gegen den wahren Parameterwert konvergiert, heißen asymptotisch erwartungstreu.
Definition (Asymptotischer Bias)
Die asymptotische erwartete Abweichung des Schätzers vom wahren Wert
lim b(θˆ,θ)= lim E(θˆ)−θ n→∞ n→∞
heißt asymptotischer Bias.
Definition ( )
θˆ(X1, . . . , Xn) heißt asymptotisch erwartungstreu für θ, wenn lim b(θˆ,θ) = 0 d.h. lim E(θˆ) = θ.
Hinweis: Jeder erwartungstreue Schätzer ist auch asymptotisch
erwartungstreu.
Prof. Burgard (FU Berlin) Schließende Se 21/22 17 / 39

Schätzen von ̈tzfunktionen und ihre Erwartungstreue: Beispiel (Fortsetzung)
Ist pˆ4 = nX1+k zumindest asymptotisch erwartungstreu für den Parameter nk
p der Binomialverteilung? limE(pˆ4)
􏰅nX1 +k􏰆 n→∞ nk
= lim nE(X1)+k
n→∞ nk = limnkp+k
= p lim n + lim 1 n→∞ n n→∞ n 􏰢􏰡􏰠􏰣 􏰢􏰡􏰠􏰣
Prof. Burgard
(FU Berlin)
Schließende Se 21/22

Schätzen von ̈tzfunktionen und ihre Erwartungstreue: Übungen
Übung 1 Prüfen Sie, ob die Schätzfunktion bˆ = 2X ̄ (asymptotisch) erwartungstreu für den Parameter b der diskreten Gleichverteilung ist (Verteilung, die die Werte X = 1, 2, . . . , b mit der Wahrscheinlichkeit b1 annimmt).
Übung 2 (schwer!)
Prüfen Sie, ob S2 = n1 􏰗ni=1(Xi − X ̄)2 ein (asymptotisch) erwartungstreuer Schätzer für den Parameter σ2 der Normalverteilung ist. ggf. eine Modifikation vor, um S2 erwartungstreu zu machen.
rechnerisch oder mit Hilfe einer Simulation herauszufinden,
√2 􏰜1􏰗n ̄2
ob σˆ = σˆ = n−1 i=1(Xi − X) (asymptotisch) erwartungstreu für σ
unter Normalverteilung ist.
Prof. Burgard (FU Berlin) Schließende Se 21/22 19 / 39

Schätzen von ̈tzfunktionen und ihre
Die Varianz einer „guten“ Schätzfunktion sollte mit wachsendem Stichprobenumfang n immer kleiner werden und für n → ∞ gleich 0 sein.
Definition (Konsistenz)
θˆ(X1, . . . , Xn) heißt eine konsistente Schätzfunktion für den Parameter θ, falls
lim E(θˆ)=θund lim V(θˆ)=0 n→∞ n→∞
Konsistenz ist eine Minimalvoraussetzung an Schätzfunktionen: Mit wachsendem Stichprobenumfang strebt die Schätzung θˆ gegen den wahren Wert θ.
Prof. Burgard (FU Berlin) Schließende Se 21/22 20 / 39

Schätzen von ̈tzfunktionen und ihre : X ̄ ein konsistenter Schätzer für den Parameter μ der Normalverteilung?
Wir haben bereits gezeigt, dass X ̄ ein erwartungstreuer Schätzer für μ ist.
( nie vergessen! Es muss immer zuerst geprüft werden, ob ein Schätzer zumindest asymptotisch erwartungstreu ist. Ist dies nicht der Fall, kann der Schätzer nicht konsistent sein!)
Prof. Burgard (FU Berlin) Schließende Se 21/22 21 / 39

Schätzen von ̈tzfunktionen und ihre : Beispiel (Cont’d)
􏰌1n 􏰍1􏰌n 􏰍
V ( X ̄ ) = V 􏰉 X i = 2 V nn
V (Xi ) = n2 = 1 nσ2 = σ2
⇒ X ̄ ist ein konsistenter Schätzer für μ. Prof. Burgard (FU Berlin) Schließende Statistik
WiSe 21/22

Schätzen von ̈tzfunktionen und ihre : Übungen
Übung 1 , dass 2X ̄ eine konsistente Schätzfunktion für den Parameter b der stetigen Gleichverteilung U(0,b) ist.
Übung 2 (vgl. Übung zur Erwartungstreue)
Sind die Schätzfunktionen
pˆ 1 = X 1 pˆ2 = X1
pˆ3 = X ̄ k
pˆ4 = nX1 + k nk
konsistent für den Parameter p der Binomialverteilung?
Prof. Burgard (FU Berlin) Schließende Se 21/22 23 / 39

Schätzen von ̈tzfunktionen und ihre Eigenschaften
Mean Squared Error
zur Beurteilung der Güte eines Schätzers:
Definition (Mean Squared Error)
Der mittlere quadratische Abstand eines Schätzers θˆ zum zu schätzenden Parameterwert θ
ˆ 􏰅􏰓ˆ 􏰔2􏰆 MSE(θ,θ) = E θ(X1,…,Xn)−θ
heißt Mean Squared Error (= MSE).
Prof. Burgard (FU Berlin) Schließende Se 21/22 24 / 39

Schätzen von ̈tzfunktionen und ihre Eigenschaften
Bias-Varianz-Zerlegung des MSE
MSE(θˆ,θ) = (E(θˆ) − θ)2 + V(θˆ) 􏰓ˆ􏰔2 ˆ
= b(θ,θ) +V(θ)
Die Konsistenz lässt sich äquivalent zu der bekannten Weise auch über den MSE definieren:
θˆ(X1, . . . , Xn) heißt eine konsistente Schätzfunktion für den Parameter θ, falls
lim MSE(θˆ,θ)=0 n→∞
Prof. Burgard (FU Berlin) Schließende Se 21/22 25 / 39

Schätzen von ̈tzfunktionen und ihre : Effizienz
• Vergleich mehrerer erwartungstreuer Schätzfunktionen: ̈tzfunktion ist bei gegebener Verteilung und festem Stichprobenumfang n die „beste“?
• bevorzugen die Schätzfunktion mit der geringsten Varianz
• über MSE-Vergleich können auch Schätzfunktionen sinnvoll verglichen
werden, die lediglich asymptotisch erwartungstreu sind
• MSE: „trade-off“ zwischen Bias und Varianz
Definition (Effizienz)
Sind θˆ1 und θˆ2 zwei Schätzfunktionen für denselben Parameter θ, so heißt θˆ1 effizienter als θˆ2, wenn für alle Werte von θ
MSE(θˆ1,θ) ≤ MSE(θˆ2,θ) gilt und für mindestens ein θ0 echt “<” gilt. Prof. Burgard (FU Berlin) Schließende Se 21/22 26 / 39 Schätzen von ̈tzfunktionen und ihre : Übung möchte untersuchen, wieviel Prozent seiner Kunden ein bestimmtes Produkt weiterempfehlen würden. einer Teilerhebung sollen 50 zufällig ausgewählte Kunden befragt werden. Welche der folgenden Schätzfunktionen für den Parameter p der hier unterstellten Binomialverteilung würden Sie zur Schätzung des interessierenden Anteils verwenden? pˆ1 = X pˆ2 = Xk pˆ3 = nX + k nk Prof. Burgard (FU Berlin) Schließende Se 21/22 27 / 39 Schätzen von Aspekte Übersicht 10 Schätzen von ̈tzfunktionen und ihre von Standardfehlern Prof. Burgard (FU Berlin) Schließende Se 21/22 28 / 39 Schätzen von • Eigenschaft, dass Schätzer unempfindlich sind gegen „Ausreißer“ und „leichte“ Modellabweichungen • empirische Erfahrung: Bis zu 10% der Daten sind „verschmutzt“, d.h. ca. 90% der Daten lassen sich gut durch ein Verteilungsmodell beschreiben, die restlichen liegen aber vom „Datenkörper“ zu weit weg bzw. stören die Anpassung • unter einer symmetrischen Verteilung sind X ̄ und der Median X ̃ konsistente Schätzer für den Erwartungswert μ • X ̄ nutzt alle Daten: Nicht robust, unter Normalverteilung jedoch effizienter als X ̃ • X ̃ nutzt nur einen (bzw. zwei) Werte: robust, jedoch unter Normalverteilung weniger effizient als X ̄ Prof. Burgard (FU Berlin) Schließende Se 21/22 29 / 39 Schätzen von Aspekte α-getrimmtes an beiden Enden des geordneten Datensatzes jeweils einen geeigneten Anteil α von Beobachtungen weg: Definition (α-getrimmtes Mittel) wobei: r größte ganze Zahl mit r ≤ nα (i.d.R. α = 0.05); X(i) = i-ter Wert der geordneten im R-Studio: mean(x, trim) Der Parameter trim entspricht dem Trimm-Anteil α. Die Standardeinstellung für trim ist 0 (es wird also das „einfache“ arithmetische Mittel berechnet). Prof. Burgard (FU Berlin) Schließende Se 21/22 30 / 39 Schätzen von Aspekte Maße für die Robustheit eines Schätzers a) Sensitivitätskurve: Einfluss einer Beobachtung auf den Schätzer (vgl. Abbildung auf der nächsten Folie). b) Bruchpunkt: gibt an, bei welchem Anteil einer sehr großen Stichprobe verschmutzte Daten beliebig große bzw. kleine Schätzwerte hervorrufen. (a) arithmetisches Mittel: Schon ein Beobachtungswert kann x ̄ beliebig groß werden lassen: Bruchpunkt = 0 (b) Median: Bruchpunkt = 0.5 (c) α-getrimmtes Mittel: Bruchpunkt= α Prof. Burgard (FU Berlin) Schließende Se 21/22 31 / 39 Schätzen von ̈tskurven X ̄ X ̃ X ̄α −4 −2 0 2 4 −4 −2 0 2 4 −4 −2 0 2 4 xxx Prof. Burgard (FU Berlin) Schließende Se 21/22 32 / 39 −4 −2 0 2 4 −1.0 −0.5 0.0 0.5 1.0 −2 −1 0 1 2 Schätzen von Aspekte Übung: Student der Geistes- und Sozialwissenschaften hat einen neuartigen Intelligenztest entwickelt. Um zur Eichung der Methode dringend erforderliche Untersuchungsergebnisse zu bekommen, stellt er den Test über eine dynamische Website ins WWW. Innerhalb von ca. 6 Monaten nehmen 2000 Personen an dem Test teil - 1304 füllten den Fragebogen vollständig aus. a) die Ergebnisse der 1304 Teilnehmer (die den Test beendet haben) aus der Datei IQ.csv in ein Datensatz-Objekt. b) die Test-Ergebnisse in einem Histogramm dar. Zur Information: Es ließen sich maximal 250 Punkte erreichen. Prof. Burgard (FU Berlin) Schließende Se 21/22 33 / 39 Schätzen von Aspekte Übung: Intelligenztest (Cont’d) c) Üblicherweise wird davon ausgegangen, dass die Ergebnisse von Intelligenztests normalverteilt sind. Schätzen Sie die Parameter μ und σ über geeignete Schätzfunktionen. d) die Dichtekurve der sich aus c) ergebenden Normalverteilung über das Histogramm aus b). Wie erklären Sie sich das Ergebnis? e) Schätzen Sie μ und σ erneut – verwenden Sie diesmal den Median und den korrigierten MAD [Funktion im RStudio: mad(x)] als Schätzer. die sich aus diesen Schätzungen ergebende Dichtekurve zusätzlich in die Graphik ein. Prof. Burgard (FU Berlin) Schließende Se 21/22 34 / 39 Schätzen von von Standardfehlern Übersicht 10 Schätzen von ̈tzfunktionen und ihre von Standardfehlern Prof. Burgard (FU Berlin) Schließende Se 21/22 35 / 39 Schätzen von von Standardfehlern Motivation • bei erwartungstreuen Schätzern reduziert sich der MSE auf die Varianz der Schätzfunktion • Größe der Varianz bzw. der Standardabweichung (=Standardfehler) bildet die Grundlage für die Einschätzung der Güte des Schätzergebnisses • Standardfehler ist in der Regel nicht bekannt und muss aus der Stichprobe geschätzt werden Prof. Burgard (FU Berlin) Schließende Se 21/22 36 / 39 Schätzen von von Standardfehlern Man verfügt über K Stichproben vom Umfang n. Für jede Stichprobe k (k = 1,...,K) kann man θˆn,k bestimmen. Näherung für den Standardfehler: σˆ θˆ = 􏰝 K − 1 wobei: θ ̄n = K1 􏰗Kk=1 θˆn,k ( θˆ n , k − θ ̄ n ) 2 • ersetze die theoretische Verteilungsfunktion F(x) durch die empirische Verteilungsfunktion Fˆ (X) • simuliere aus Fˆ (x) K einfache Zufallsstichproben mit Zurücklegen n vom Umfang n • Bestimmung von σˆθˆ wie oben Prof. Burgard (FU Berlin) Schließende Se 21/22 37 / 39 Schätzen von von : Bootstrap in R # Daten einlesen daten <- read.csv2("Umfrage2015SoSe.csv") # Körpergrö ß e Frauen groW <- daten$GRO[daten$GESCHL==2] n <- length(groW) # Schätzung Mittelwert (auf Basis des Samples) mean(groW) # Simulation neuer Samples gemä ß emp. Verteilung durch Ziehen mit Zurücklegen bootSamples <- as.matrix(replicate(5000,sample(groW,n, replace=T))) # Schätzung Mittelwert (auf Basis der einzelnen Bootstrap mu <- apply(bootSamples,2,mean) Prof. Burgard (FU Berlin) Schließende Se 21/22 38 / 39 Schätzen von von : Bootstrap in R (Cont’d) # Histogramm der geschätzten Mittelwerte hist(mu,xlab="gesch. Mittelwerte",ylab="Hfkt.-dichte", main="Bootstrap-Schätzung",freq=F) # Varianz der Schätzung des Mittelwertes Bootstrap−Schätzung 167 168 169 170 gesch. Mittelwerte Prof. Burgard (FU Berlin) Schließende Se 21/22 39 / 39 Hfkt.−dichte 0.0 0.2 0.4 0.6 0.8 程序代写 CS代考 加微信: powcoder QQ: 1823890830 Email: powcoder@163.com