代写代考 Stichprobenfunktionen

Stichprobenfunktionen
9. Stichprobenfunktionen
Prof. Burgard (FU Berlin) Schließende Se 21/22 1 / 25

Copyright By PowCoder代写 加微信 powcoder

Stichprobenfunktionen
Übersicht
9 Standardmodell der spezieller Stichprobenfunktionen
Prof. Burgard (FU Berlin) Schließende Se 21/22 2 / 25

Standardmodell der Statistik
Übersicht
9 Standardmodell der spezieller Stichprobenfunktionen
Prof. Burgard (FU Berlin) Schließende Se 21/22 3 / 25

Standardmodell der
Viele statistische Problemstellungen haben zum Ziel, Aussagen über Merkmale sehr vieler Untersuchungseinheiten zu treffen.
Beispiele:
• Anzahl potenzieller Nutzer eines zu entwickelnden Produktes auf einem internationalen Markt.
• Einschätzung der Kundenzufriedenheit bei den Nutzern eines Konsumproduktes.
• Verteilung des Einkommens aller Haushalte in Deutschland.
• Kapazität der (nicht-aufladbaren) AA-Batterien, die in einer
Fertigungsstätte produziert werden.
Prof. Burgard (FU Berlin) Schließende Se 21/22 4 / 25

Standardmodell der mit umfangreichen Grundgesamtheiten
Die genau spezifizierte Menge aller interessierenden Untersuchungseinheiten wird Grundgesamtheit genannt.
Probleme in Zusammenhang mit sehr umfangreichen Grundgesamtheiten:
• Abgrenzbarkeit: In vielen Fällen ist eine exakte Abgrenzung (gehört eine Untersuchungseinheit zur Grundgesamtheit oder nicht) vorab schwierig (z.B. sind dem Hersteller eines Joghurts seine Kunden i.d.R. nicht namentlich bekannt).
• Kosten: Die Erfassung der Ausprägungen der Merkmale bei sehr vielen Untersuchungseinheiten kann extrem kostspielig sein (z.B. Befragung von allen Nutzern eines Produktes).
Prof. Burgard (FU Berlin) Schließende Se 21/22 5 / 25

Standardmodell der mit umfangreichen Grundgesamtheiten (Cont’d)
• Zeit: Die Erfassung der Ausprägung der Merkmale bei sehr vielen Untersuchungseinheiten kann zu lange dauern. (Daten als Entscheidungsgrundlage für die Gestaltung einer kurzfristigen Promotion-Aktion werden binnen weniger Tage benötigt, eine Befragung einiger 10000 Kunden ist in dieser Zeit nicht realisierbar.)
• In einigen Fällen ändert sich die Ausprägung des interessierenden Merkmals durch die Messung (z.B. muss eine Batterie vollständig entladen werden, um die genaue Kapazität bestimmen zu können).
Prof. Burgard (FU Berlin) Schließende Se 21/22 6 / 25

Standardmodell der Statistik
Lösungsmöglichkeit
• nicht alle Einheiten der Grundgesamtheit untersuchen (Totalerhebung)
• nach einem bestimmten Auswahlverfahren (→ ) eine Stichprobe ziehen
• die Ausprägung des interessierenden Merkmals bei den
Untersuchungseinheiten in der Stichprobe messen
• anhand der Untersuchung der Stichprobe gewonnenen Ergebnisse auf die Population der Grundgesamtheit übertragen (Inferenzstatistik)
Prof. Burgard (FU Berlin) Schließende Se 21/22 7 / 25

Standardmodell der
• weist eine Stichprobe hinsichtlich gewisser interessierender Merkmale die gleichen Charakteristika wie die Grundgesamtheit auf, so wird die Stichprobe als repräsentativ bezeichnet
• werden die Einheiten in der Stichprobe durch eine echte Zufallsauswahl gezogen, so ist der Prozess der Messung der Ausprägung des interessierenden Merkmals ein Zufallsexperiment
• interessierendes Merkmal selbst können wir als Zufallsvariable X auffassen
• wird das Zufallsexperiment n mal wiederholt (Stichprobe vom Umfang n), so betrachten wir n Zufallsvariablen, die wir durch einen Index kennzeichnen: X1, X2, . . . , Xn
• gemessene Werte sind die konkreten Ausprägungen der Merkmale bei der i. (i = 1,…,n) Untersuchungseinheit x1,x2,…,xn.
Prof. Burgard (FU Berlin) Schließende Se 21/22 8 / 25

Standardmodell der : Einstellung zu einer Internet-Versandhändler möchte seinen Bekanntheitsgrad messen. Das interessierende Merkmal können wir als diskrete Zufallsvariable mit zwei Ausprägungen modellieren:
Name des Versandhändlers ist
der Untersuchungseinheit. . . bekannt nicht bekannt Ausprägung X =1 X =0
sollen alle potenziellen Kunden des Versandhändlers im nationalen Markt zählen. Die Marketingabteilung hat folgende Abgrenzung getroffen: sind alle Personen zwischen 18 und 59 Jahren, die das Internet mindestens einmal pro Monat (privat oder dienstlich) nutzen und über eine Post-Anschrift in Deutschland verfügen.
Prof. Burgard (FU Berlin) Schließende Se 21/22 9 / 25

Standardmodell der : Einstellung zu einer Marke (Cont’d)
Es soll eine Teilerhebung durchgeführt werden. Dazu werden n = 1000 Personen telefonisch befragt. dazu wird an ein Marktforschungsunternehmen mit Callcenter vergeben, das verspricht, die Personen in der Stichprobe über ein zufälliges Auswahlverfahren zu rekrutieren (tatsächlich treten in diesem Schritt zahlreiche Probleme auf, die hier aber nicht weiter thematisiert werden).
erhält der Versandhändler eine EXCEL-Datei mit 1000 Eintragungen (jeweils 0 oder 1). Wir fassen diese Daten als Realisierungen xi der Zufallsvariablen Xi (i = 1, 2, . . . , 1000) auf.
Prof. Burgard (FU Berlin) Schließende Se 21/22 10 / 25

Standardmodell der Standardmodell der Standardmodell der Statistik geht von unabhängigen und identisch verteiltenZufallsgrößenX1,…,Xn aus:
X1,…,Xn iid mit Xi ∼ F
Hierbei steht iid für: independent identically distributed (unabhängig
identisch verteilt)
Frage: Wann ist die Körpergröße einer Person eine zufällige Größe?
Prof. Burgard (FU Berlin) Schließende Se 21/22 11 / 25

Standardmodell der Statistik
Situation I
Die Person ist nicht festgelegt.
Aus einem Personenregister werden zufällig nacheinander n Personen ausgewählt.
Größe der 1. ausgewählten Person
Größe der 2. ausgewählten Person . .
Größe der n. ausgewählten Person
Prof. Burgard
(FU Berlin)
Schließende Se 21/22

Standardmodell der Statistik
Situation I: Anforderungen an die Auswahl
a) Die Auswahl der Personen ist unabhängig voneinander.
b) Die Auswahlwahrscheinlichkeit darf nicht von der Körpergröße
abhängen.
Die Anforderung a) sichert die Unabhängigkeit der Größenmessungen. Die Anforderung b) ist für die Interpretation der Ergebnisse auf Basis der Stichprobe essentiell.
Prof. Burgard (FU Berlin) Schließende Se 21/22 13 / 25

Standardmodell der Statistik
Situation I: Verletzung der :
Die Auswahlwahrscheinlichkeit der Personen ist proportional zu ihrer Körpergröße.
i) Die Verteilung der Stichprobe wird gegenüber der Verteilung in der Gesamtpopulation zu größeren Körpergrößen „verschoben“.
ii) Die Normalverteilung ist kein angemessenes Modell für die Daten der Stichprobe, während sie für die Grundgesamtheit angemessen erscheint. Insbesondere lässt X ̄ = n1 􏰗ni=1 Xi keine Rückschlüsse auf den Mittelwert der Normalverteilung der Grundgesamtheit zu.
Prof. Burgard (FU Berlin) Schließende Se 21/22 14 / 25

Standardmodell der Statistik
Situation II
Die Person ist festgelegt, d.h. xi ist die Körpergröße der Person i. In diesem Fall ist xi keine zufällige Größe.
In Situation II wird daher kein statistisches Modell für die Körpergröße über die erhobenen Daten geschätzt.
Trotzdem werden Aussagen über das Vorkommen der Körpergröße in der Grundgesamtheit gemacht, z.B. durchschnittliche Körpergröße in der Grundgesamtheit oder Anteil der Personen zwischen xmin und xmax in der Grundgesamtheit.
Prof. Burgard (FU Berlin) Schließende Se 21/22 15 / 25

Standardmodell der Statistik
Situation III
Die Person ist festgelegt, jedoch ist die Körpergröße noch nicht festgelegt, z.B. weil Personen noch Kinder sind und die Körpergröße als Körpergröße im Erwachsenenalter definiert ist.
Situation III beschreibt alle experimentellen Designs. Klassisch ist dieses Design in der Agrarforschung:
• Die Einheiten sind einzelne Pflanzen oder Flächenstücke. Das interessierende Merkmal ist der Ertrag dieser Einheiten nach Anwendung unterschiedlicher Düngemethoden.
• Betriebswirtschaftliches Pendant: Verkaufszahlen von Einzelgeschäften bzw. regionalen Verkaufsbereichen nach unterschiedlichen Werbemaßnahmen.
Prof. Burgard (FU Berlin) Schließende Se 21/22 16 / 25

Standardmodell der Statistik
Situation III: Verletzung der Annahmen
In der Regel ist hier die Annahme verletzt, dass die Verteilung für die Einheiten identisch ist.
a) Körpergröße im Erwachsenenalter hängt ab von: aktueller Körpergröße
Körpergröße des ̈rpergröße der Mutter b) Ertrag hängt ab von:
Art des Düngers ̈t des Bodens
c) Verkaufszahlen hängen ab von:
Verkaufszahlen in der Vorperiode
Art des ̈t des Werbeeinsatzes
Prof. Burgard (FU Berlin) Schließende Se 21/22 17 / 25

Standardmodell der Statistik
Situation III: ̈ngigkeit der Verteilung des Merkmals von den verschiedenen Einflussgrößen, z.B.
μi = Erwartungswert der Person i
= μi (aktuelle Körpergröße, Körpergröße Vater, Körpergröße Mutter)
sind Gegenstand der Varianzanalyse bzw. der Regressionsanalyse (vgl. Kapitel 13).
Lediglich wenn alle Einflussgrößen ignoriert werden, ist die Annahme einer identischen Verteilung des Merkmals angemessen.
Prof. Burgard (FU Berlin) Schließende Se 21/22 18 / 25

Standardmodell der Statistik
„Reine“ Zufallsauswahl
Die meisten Lehrbücher fordern daher eine „reine“ Zufallsauswahl der Einheiten, bei der jede Einheit der Grundgesamtheit dieselbe Chance hat, in die Stichprobe zu gelangen. In der Praxis ist die „reine“ Zufallsauswahl eine kaum erfüllbare Forderung. Insbesondere bei:
• Patienten: Untersuchung von Krankheitsverläufen
Die „Auswahl“ geschieht meist über Einweisung in ein Krankenhaus. Möglichkeit, dass nur besonders ungünstige Krankheitsverläufe beobachtet werden.
• Die meisten Marktforschungsinstitute führen aus Kostengründen kein zufälliges Ziehungsverfahren durch, sondern lediglich ein Quotenverfahren. Hierbei werden für bestimmte Personengruppen bestimmte Anteile (Quoten) an der Stichprobe festgelegt. Wie die Interviewer jedoch an die Befragungspersonen kommen, wird nicht kontrolliert.
Prof. Burgard (FU Berlin) Schließende Se 21/22 19 / 25

Standardmodell der
Auch bei Anwendung einer Zufallsauswahl wird meist keine „reine“, d.h. einfache Zufallsstichprobe gewählt. In diesem Fall sind Eigenarten des Ziehungsverfahrens wesentlich.
Personenstichprobe kann über die Ziehung von Haushalten gewonnen werden. In diesem Fall sind alle Personenmerkmale, die über den Haushaltskontext definiert sind (z.B. Miete) abhängig für alle Personen des Haushalts.
Die Interpretierbarkeit der Ergebnisse für die Grundgesamtheit sollte daher im Einzelfall genau begründet werden.
Prof. Burgard (FU Berlin) Schließende Se 21/22 20 / 25

spezieller Stichprobenfunktionen
Übersicht
9 Standardmodell der spezieller Stichprobenfunktionen
Prof. Burgard (FU Berlin) Schließende Se 21/22 21 / 25

spezieller
Werden die Zufallsgrößen X1, . . . , Xn über eine Stichprobe definiert und gilt die iid-Annahme, so nennt man die Xi auch Stichprobenvariablen.
g (X1, . . . , Xn) heißt dann Stichprobenfunktion. sind:
g1 (X1,…,Xn) g2(X1,…,Xn)
= n1 􏰗 ni = 1 X i
= 1 􏰗n 􏰃Xi−X ̄􏰄2 n−1 i=1
= S2 c) Für festes x ∈ R:
g3(X1,…,Xn)
= Anteil der Stichprobe
mit Werten ≤ x Schließende Statistik
Prof. Burgard (FU Berlin)
WiSe 21/22

spezieller Stichprobenmittel X ̄
X1,…,Xn iid mit E(Xi) = μ und V (Xi) = σ2
Eigenschaften
a) E(X ̄)=μ
b) „√n“-Gesetz: σ ̄ = σ
c) „ der großen Zahlen“ (vgl. Kapitel 4)
lim P(|X ̄−μ|≤ε)=1 ε>0 n→∞
d) von X ̄ über den zentralen Grenzwertsatz: ̄ σ2
X ∼: N(μ, n )
Prof. Burgard (FU Berlin) Schließende Se 21/22 23 / 25

spezieller : Eiegnschaften von E(X) und V(X) In Zusammenhang mit Stichprobenfunktionen sind die folgenden
Rechenregeln bzgl. Erwartungswert und Varianz, die bereits aus Statistik 1 bekannt sind, von Bedeutung:
• Für zwei Zufallsvariablen X1 und X2 mit den Erwartungswerten E(X1) und E(X2) gilt:
E(aX1+b)=aE(X1)+b a,b∈R E(X1 + X2) = E(X1) + E(X2)
• Für zwei Zufallsvariablen X1 und X2 mit den Varianzen V(X1) und V (X2) gilt:
V(aX1+b)=a2V(X1) a,b∈R Sind X1 und X2 unabhängig, so gilt weiterhin:
V (X1 + X2) = V (X1) + V (X2)
Prof. Burgard (FU Berlin) Schließende Se 21/22 24 / 25

spezieller Stichprobenfunktionen
Die Zufallsvariable Xi gebe an, ob eine zufällig ausgewählte Person am Vortag die 20 Uhr-Tagesschau gesehen hat, d.h.
, wenn die Person die Tagesschau gesehen hat
, wenn die Person die Tagesschau nicht gesehen hat
(i = 1,2,…,n) • Was geben dann Y = 􏰗ni=1 Xi und
X ̄ = n1 􏰗ni=1 Xi für eine Stichprobe vom Umfang n an?
• Wir unterstellen das Wahrscheinlichkeitsmodell P(Xi = 0) = 0.8 und P(Xi = 1) = 0.2. E(Y), E(X ̄), V(Y) und V(X ̄) unter derAnnahme,dassX1,…,Xn unabhängigsind.
Prof. Burgard (FU Berlin) Schließende Se 21/22 25 / 25

程序代写 CS代考 加微信: powcoder QQ: 1823890830 Email: powcoder@163.com