Normalverteilung
8. Normalverteilung
Prof. Burgard (FU Berlin) Schließende Se 21/22 1 / 48
Copyright By PowCoder代写 加微信 powcoder
Normalverteilung
Übersicht
Definition und zentrale Grenzwertsatz Approximation der Normalverteilung
Prof. Burgard (FU Berlin) Schließende Se 21/22 2 / 48
Die Normalverteilung besitzt in der Statistik eine herausragende Bedeutung.
Die Normalverteilung ist kein natürliches Verteilungsmodell für alle empirischen Phänomene!
resultiert aus dem zentralen Grenzwertsatz der Wahrscheinlichkeitstheorie: ̈ßen als Summe von vielen unabhängigen Einflussgrößen.
Prof. Burgard (FU Berlin) Schließende Se 21/22 3 / 48
Übersicht
Definition und zentrale Grenzwertsatz Approximation der Normalverteilung
Prof. Burgard (FU Berlin) Schließende Se 21/22 4 / 48
Motivation
Problemstellung:
Produkte müssen so gestaltet werden, dass sie für einen großen Anteil der Käufer geeignet sind. Zu diesem Zweck benötigt man in der von Merkmalen der Käufer in Form von extremen Quantilen.
Beispiele: Höhe der Sitzfläche bei Stühlen, Position der Armaturen oder Höhe der Fahrgastzelle im Auto, Größe der Tasten beim Handy, . . .
Die extremen Quantile werden aber durch empirische Verteilungen nur unzuverlässig geschätzt.
Unter einem statistischen Modell können die theoretischen Quantile benutzt werden.
Prof. Burgard (FU Berlin) Schließende Se 21/22 5 / 48
Eigenschaften empirischer Verteilungen haben häufig folgende Eigenschaften: • (annähernd) symmetrisch um den Modus
• auf den mittleren Bereich um den Modus konzentriert
( ist der in der Stichprobe am häufigsten vorkommende Wert.) In diesen Fällen ist die Normalverteilung ein gutes Modell.
Prof. Burgard (FU Berlin) Schließende Se 21/22 6 / 48
Größe von ̈ße der weiblichen Vorlesungsbesucher
150 160 170
180 190 200
Größe in cm
Größe der männlichen Vorlesungsbesucher
150 160 170
180 190 200
Größe in cm
Quelle: 2015
Prof. Burgard (FU Berlin) Schließende Se 21/22 7 / 48
Hfkt.−dichte Hfkt.−dichte
0.00 0.02 0.04 0.00 0.02 0.04
Unter folgenden Sachverhalten erweisen sich Zufallsgrößen häufig als normalverteilt:
• Zufallsgröße beschreibt natürliche Variation: Körpergröße, Gewicht, usw.
• Zufallsgröße beschreibt das Ergebnis einer Messung einer physikalischen Größe: Entfernung zwischen zwei Punkten, Gewicht einer Person, Reaktionsdauer einer Person auf ein Signal, usw.
• Zufallsgröße entsteht als Summe unterschiedlicher Zufallseinflüsse: Intelligenzquotient (Summe aus Punkten vieler Einzelfragen), Benzinverbrauch pro 100 km im Stadtverkehr (Einflussfaktoren: Verkehrsdichte, Zahl der roten Ampeln, Temperatur, usw.), usw.
Prof. Burgard (FU Berlin) Schließende Se 21/22 8 / 48
Normalverteilung
Definition und Eigenschaften
Übersicht
Definition und zentrale Grenzwertsatz Approximation der Normalverteilung
Prof. Burgard (FU Berlin) Schließende Se 21/22 9 / 48
Normalverteilung
Definition und Eigenschaften
Definition
Definition (Normalverteilung)
X heißt normalverteilt mit den Parametern μ und σ, X ∼ N(μ, σ2), wenn ihre Dichte gegeben ist durch:
1 −1(x−μ)2
f(x)=√ e2 σ x∈R
• μ beschreibt die Lage und den Modalwert der Verteilung:
f(x)maximalbeix=μmitf(μ)=√1 1 2π σ
• Je größer σ desto „flacher“ ist die Dichte und je größer ist folglich die Streuung von X.
Es lässt sich zeigen:
a) E(X)=μ b) V(X)=σ2
Prof. Burgard (FU Berlin) Schließende Se 21/22 10 / 48
Aufbau der Dichte
(1) Grundbaustein: e−x2
(2) Lageparameter: e−(x−μ)2
σ (3) Skalenparameter: e−(x−μ )2
Normalverteilung
Definition und Eigenschaften
(4) Normierung d. Fläche:
1 e−1(x−μ)2 √2σ
0.0 0.2 0.4
0.6 0.8 1.0
−6 −4 −2 0 2 4 6
Prof. Burgard
(FU Berlin) Schließende Se 21/22 11 / 48
Dichten der Normalverteilung
Normalverteilung Definition und der Normalverteilung
0.0 0.2 0.4 0.6 0.8
−6 −4 −2 0 2 4 6
Prof. Burgard (FU Berlin) Schließende Se 21/22 12 / 48
Normalverteilung
Definition und der Normalverteilung
a) X ∼N(μ,σ2)
Y = a + bX b ̸= 0
Esgilt:Y ∼N(a+bμ,b2σ2)
Also: E (Y ) = a + bE (X ) = a + bμ
V(Y) = b2V(X) = b2σ2
b) Die Linearkombination unabhängiger, normalverteilter Zufallsgrößen
X1,…,Xn mitXi ∼N(μi,σi2)istwiedernormalverteilt:
nnn aiXi ∼N aiμi,ai2σi2
i=1 i=1 i=1
Prof. Burgard (FU Berlin)
Schließende Se 21/22 13 / 48
Normalverteilung
Definition und
X ∼ N(μ, σ2) ⇒ Z = X − μ ∼ N(0, 1) σ
Die Verteilungsfunktion der Standardnormalverteilung wird üblicherweise mit Φ(x) („Phi“) bezeichnet.
Prof. Burgard (FU Berlin) Schließende Se 21/22 14 / 48
Normalverteilung
Definition und der Normalverteilung (Cont’d)
c) Beziehung zwischen dem p-Quantil xp der N(μ,σ2)-Verteilung und dem p-Quantil zp der Standardnormalverteilung besteht die Beziehung
zp = xp − μ bzw. σ
Insbesondere gilt:
P(X ≤ x) = Φ d) Symmetrie bezüglich μ:
xp = μ + σzp x − μ
P(X ≤μ−c)=P(X ≥μ+c) D.h. F(μ − c) = 1 − F(μ + c).
Prof. Burgard (FU Berlin) Schließende Se 21/22 15 / 48
Normalverteilung
Definition und Eigenschaften
Befehle im R-Studio:
dnorm(x, mean, sd) Dichtefunktion pnorm(q, mean, sd) Verteilungsfunktion qnorm(p, mean, sd) Quantilsfunktion rnorm(n, mean, sd) Zufallszahlengerator
Die Parameter mean (Voreinstellung 0) und sd (Voreinstellung 1) entsprechen den Parametern μ und σ der Normalverteilung.
Achtung: Die Befehle verlangen nach der Eingabe von σ (nicht σ2)!
Prof. Burgard (FU Berlin) Schließende Se 21/22 16 / 48
Normalverteilung
Definition und der Form : {μ − c ≤ X ≤ μ + c}
Häufig ist die Wahrscheinlichkeit für die Beobachtung des Ereignisses durch
einen festen Wert 1 − α vorgegeben:
P(μ − c ≤ X ≤ μ + c) = 1 − α
Zu einem vorgegebenen α lässt sich der zugehörige Wert c über die Quantile der Standardnormalverteilung bestimmen.
Es gilt für:
X ∼N(μ,σ2)
P(μ−z1−α2 σ≤X≤μ+z1−α2σ)=1−α
Prof. Burgard (FU Berlin)
Schließende Se 21/22
Normalverteilung
Definition und
Schwankungsinterval
α2 α2 μ−c μ μ+c
Prof. Burgard (FU Berlin) Schließende Se 21/22 18 / 48
Normalverteilung
Definition und Eigenschaften
k-faches Schwankungsintervall
P(μ−1σ≤X ≤μ+1σ)=1−0.3173≈0.68
P(μ−2σ≤X ≤μ+2σ)=1−0.0455≈0.95
P(μ−3σ≤X ≤μ+3σ)=1−0.0027≈0.997
Prof. Burgard (FU Berlin) Schließende Se 21/22 19 / 48
Normalverteilung
Definition und Eigenschaften
Übung: Größe der Studierenden
Die Größe der Studierenden X (in cm) der 1 im SoSe 2012 folge einer Normalverteilung N(μ = 176, σ2 = 8.92).
a) die Wahrscheinlichkeit, mit der ein zufällig ausgewählter Studierender höchstens 170 cm groß ist.
b) die Dichte an der Stelle x=170 cm (per Hand und mit Hilfe des R-Studios).
c) Wie hoch müsste ein Türrahmen sein, damit 99 % der Studierenden sich beim Betreten des Raumes nicht den Kopf stoßen? den Wert aus der Tabelle ab und bestimmen Sie ihn anschließend mit Hilfe des R-Studios.
d) Wie hoch müsste der Türrahmen dem Modell nach konstruiert werden, damit es unmöglich ist, dass sich jemand beim Betreten des Raumes den Kopf stößt?
Prof. Burgard (FU Berlin) Schließende Se 21/22 20 / 48
Normalverteilung
Definition und Eigenschaften
Übung: Sprechzeit eines Mobiltelefons
Die reine Sprechzeit bei einem Mobiltelefon ist mit 4 Stunden angegeben und liegt durchschnittlich bei 250 Minuten. Es sei angenommen, dass die Sprechzeit X (in Minuten) normalverteilt sei mit einer Standardabweichung von σ=5 Minuten.
a) Warum variiert die Sprechzeit des Telefons?
b) Wie groß ist die Wahrscheinlichkeit, dass ein Akku weniger als 4
c) Wie groß ist die Wahrscheinlichkeit, dass ein Akku mehr als 255
d) wird von 80% der Akkus überschritten?
e) das zweifache zentrale Schwankungsintervall an.
f) die Grenzen des zentralen Schwankungsintervalls, in das 90% aller hergestellten Akkus fallen.
Prof. Burgard (FU Berlin) Schließende Se 21/22 21 / 48
Normalverteilung
Definition und ̈tzung von μ und σ2
Ersetzen von E(X) durch x ̄ und V(X) = s2 liefert:
1 n μˆ=x ̄=n xi
σˆ2 = s2=n (xi−x ̄)2 i=1
Hinweis: Bei der Schätzung von σ wird i.d.R. durch n − 1 (statt n) geteilt.
Prof. Burgard (FU Berlin) Schließende Se 21/22 22 / 48
Normalverteilung
Definition und : Ausstattungsdesigner will die Maße der produzierten Modeartikel so wählen, dass 90% der Zielgruppe berücksichtigt werden. Deshalb werden am oberen und am unteren Ende der Verteilung je 5% abgeschnitten.
Für die Zielgruppe der Männer nehmen wir aufgrund einer vorigen Schätzung an, dass die Körpergröße X (in mm) wie folgt verteilt ist:
X ∼ N(1738.1, 682).
Damit erhalten wir für das 95%-Quantil:
x0.95 = μ+σz0.95=
= 1738.1 + 68 · 1.645 = 1849.96
Analog für das 5%-Quantil:
z0.05 = −z1−0.05 = −z0.95
und deshalb: x0.05 = . . . = 1626.24
Prof. Burgard (FU Berlin) Schließende Se 21/22 23 / 48
Normalverteilung
Definition und : Ausstattungsdesigner (Cont’d)
Das zentrale Schwankungsintervall ist damit: [1626.25, 1849.95].
Prof. Burgard (FU Berlin) Schließende Se 21/22 24 / 48
Normalverteilung
Definition und Eigenschaften
QQ- : Überprüfung ob realisierte Daten aus einer Normalverteilung stammen
(vgl. Statistik 1) 1.) Ausgangspunkt:Datenx1,…,xn 2.) Schätze: μ und σ2
sortierte Daten vs. theoretische Quantile
x(1),…,x(i),…,x(n) tp=1/n,…,tp=i/n,…,tp=1 4.) Prüfe ob Daten auf der Diagonalen liegen
Prof. Burgard (FU Berlin) Schließende Se 21/22 25 / 48
Normalverteilung
Definition und Eigenschaften
QQ-Plot im Falle der X ∼ N(μ, σ2), zp Quantile von N(0, 1) ⇒x(i) ≈μ+σzp=i/n
Modifizierter QQ-Plot: Plotte die empirischen Quantile gegen die theoretischen Quantile der Standard-Normalverteilung. Die Punkte streuen um eine Gerade mit dem Achsenabschnitt μ und der Steigung σ (Ausgleichsgerade).
qqnorm(x) Erstellt einen QQ-Plot für x gegen eine Normalverteilung qqline(x) Ausgleichsgerade zum QQ-Plot qqnorm(x) mit
geschätzten μˆ und σˆ
Prof. Burgard (FU Berlin) Schließende Se 21/22 26 / 48
Normalverteilung
Definition und : Ernteerträge
In einem Experiment wurde der Ernteertrag (Variable Ertrag) von 6 (Variable Sorte) in 4 Betrieben (Variable Betrieb) jeweils mit 3 Wiederholungen (Variable Schlag) gemessen (Datensatz: Gerste.xls, insg. 72 Beobachtungen). Für die Erträge ergibt sich folgender QQ-Plot:
# Einlesen der Daten
daten <- read.csv2("Gerste.csv") # QQ-Plot (Normalverteilung)
qqnorm(daten$Ertrag) qqline(daten$Ertrag, col="red")
Prof. Burgard (FU Berlin) Schließende Se 21/22 27 / 48
Normalverteilung
Definition und : Ernteerträge (Cont’d)
Normal Q−Q Plot
−2 −1 0 1 2 Theoretical Quantiles
und Steigung ergeben sich: μ = 38.625, σ = 11.305. Prof. Burgard (FU Berlin) Schließende Se 21/22 28 / 48
Sample Quantiles
20 30 40 50 60
zentrale Grenzwertsatz
Übersicht
Definition und zentrale Grenzwertsatz
Approximation der Normalverteilung
Prof. Burgard (FU Berlin) Schließende Se 21/22 29 / 48
zentrale als Summe unabhängiger Elementarfehler
1. streuen symmetrisch um den wahren Wert, alle Abweichungen sind gleichwahrscheinlich
→ Gleichverteilung auf dem Intervall [−c,c]
2. ist die Summe von 2 Elementarfehlern. Die Summe
X = X1 + X2 von zwei unabhängigen gleichverteilten Zufallsvariablen ist dreiecks-verteilt.
sind häufiger als große → Dreieckförmige Verteilung auf dem Intervall [−c′, c′].
Gesamtfehler ist die Summe von vielen unabhängigen Elementarfehlern.
Prof. Burgard (FU Berlin) Schließende Se 21/22 30 / 48
zentrale als Summe unabhängiger Elementarfehler (Bild)
X1(gleichverteilt) X1 + X2 X1 + X2 + X3
−2 −1 0 1 2 −3 −2 −1 0 1 2 3 −4 −2 0 2
Prof. Burgard (FU Berlin) Schließende Se 21/22 31 / 48
0.0 0.1 0.2
0.3 0.4 0.5
0.0 0.1 0.2
0.3 0.4 0.5
0.0 0.1 0.2
0.3 0.4 0.5
zentrale Grenzwertsatz
Theorem ( )
X1, . . . , Xn seien unabhängig identisch verteilte Zufallsgrößen mit E(Xi)=μ und V(Xi)=σ2 >0
Dann konvergiert die Verteilung der standardisierten Summen dieser Zufallsvariablen
ni=1Xi−nμ 1nXi−μ Zn= √2 =√n σ
mit steigender Anzahl der Summanden gegen die Standardnormalverteilung:
lim P(Zn ≤z)=Φ(z) füralle z∈R n→∞
Bezeichnung: Zn ∼: N(0,1) („asymptotisch verteilt“)
Prof. Burgard (FU Berlin) Schließende Se 21/22 32 / 48
• Die Standardisierung ist notwendig!
• Die Konvergenz ist bei symmetrischen Ausgangsverteilungen schneller als bei asymmetrischen. Je schiefer die Ausgangsverteilung ist, umso langsamer ist die Konvergenz.
• Die Konvergenz ist bei stetigen Ausgangsverteilungen schneller als bei diskreten.
• Die praktische Bedeutung des zentralen Grenzwertsatzes liegt darin, dass eine endliche Summe von unabhängigen und identisch verteilten Zufallsgrößen in guter Näherung als normalverteilt angesehen werden kann (Tabellierung von Verteilungen).
Die Konvergenz gegen die Normalverteilung lässt sich sehr anschaulich mit Hilfe von simulierten Zufallsgrößen demonstrieren.
Prof. Burgard (FU Berlin) Schließende Se 21/22 33 / 48
zentrale Grenzwertsatz
Simulation zum ZGWS
Allgemein:
• für symmetrische Verteilungen
• für schiefe Verteilungen
• keine Konvergenz bei extremer Varianz (Cauchy-Verteilung)
Prof. Burgard (FU Berlin) Schließende Se 21/22 34 / 48
zentrale : Gleichverteilung
Histogram of x1
Histogram of x2
−4 −2 0 2 4
Histogram of x5
−4 −2 0 2 4
Histogram of x10
−4 −2 0 2 4
−4 −2 0 2 4
Prof. Burgard (FU Berlin) Schließende Se 21/22 35 / 48
0.0 0.1 0.2 0.3 0.4 0.5 0.6
0.0 0.1 0.2 0.3 0.4 0.5 0.6
0.0 0.1 0.2 0.3 0.4 0.5 0.6
0.0 0.1 0.2 0.3 0.4 0.5 0.6
zentrale : Gleichverteilung (Cont’d)
Histogram of x20
Histogram of x30
−4 −2 0 2 4
Histogram of x50
−4 −2 0 2 4
Histogram of x100
−4 −2 0 2 4
−4 −2 0 2 4
Prof. Burgard (FU Berlin) Schließende Se 21/22 36 / 48
0.0 0.1 0.2 0.3 0.4 0.5 0.6
0.0 0.1 0.2 0.3 0.4 0.5 0.6
0.0 0.1 0.2 0.3 0.4 0.5 0.6
0.0 0.1 0.2 0.3 0.4 0.5 0.6
Normalverteilung
Approximation der Binomialverteilung
Übersicht
Definition und zentrale Grenzwertsatz Approximation der Normalverteilung
Prof. Burgard (FU Berlin) Schließende Se 21/22 37 / 48
Normalverteilung
Approximation der von Laplace und De Verteilungen lassen sich selber als Summe von unabhängigen und identisch verteilten Zufallsgrößen darstellen. Dies gilt auch für die Binomialverteilung
X1,…,Xn ∼ B(1,p) ⇒ Xi ∼ B(n,p)
Theorem (Grenzwertsatz von Laplace und DeMoivre)
X ∼ B(n,p), dann ist:
X − np Y=np(1−p)∼: N(0,1)
Faustregel: np ≥ 10 und n(1 − p) ≥ 10
Prof. Burgard (FU Berlin) Schließende Se 21/22 38 / 48
Normalverteilung
Approximation der Binomialverteilung
Übung: Grenzwertsatz von Laplace und DeMoivre
Lösen Sie die folgende Aufgabe mit Hilfe des R-Studios.
a) k=1000 Zufallszahlen aus einer Binomialverteilung
Y ∼B(n=36,p=0.5).
b) die empirische Verteilungsfunktion, die sich aus den k=1000 Werten ergibt, dar. Erwartungswert und Varianz von Y an.
c) jetzt die Standardisierung (Variable: z). die empirische Verteilungsfunktion von z grafisch dar.
d) in die Grafik zusätzlich die theoretische Verteilungsfunktion der Standardnormalverteilung ein. Was fällt Ihnen auf ?
Hinweis: Die Approximation der Binomialverteilung durch die Normalverteilung ist insbesondere aus historischen Gründen von Bedeutung. Als man noch nicht den PC zur Verfügung hatte, war man auf die Approximation immer dann angewiesen, wenn die interessierende Binomialverteilung nicht „vertafelt“ war.
Prof. Burgard (FU Berlin) Schließende Se 21/22 39 / 48
Normalverteilung
Approximation der Binomialverteilung
Übung: Schwarzfahrer im ÖPNV
Ein Unternehmen des öffentlichen Nahverkehrs geht davon aus, dass 5% der Fahrgäste „Schwarzfahrer“ sind. Bei einer Kontrolle werden n = 200 Personen überprüft. approximativ über den zentralen Grenzwersatz die Wahrscheinlichkeit, dass bei der Kontrolle. . .
a) höchstens sechs Personen schwarzfahren,
b) alle Personen einen Fahrschein haben,
c) genau zehn Personen keinen Fahrschein haben.
Prof. Burgard (FU Berlin) Schließende Se 21/22 40 / 48
Normalverteilung
Übersicht
Definition und zentrale Grenzwertsatz Approximation der Normalverteilung
Prof. Burgard (FU Berlin) Schließende Se 21/22 41 / 48
Normalverteilung
Definition
In wichtigen Spezialfällen der Analyse ökonomischer Daten ist die beobachtete Zufallsgröße nicht normalverteilt, sondern erst eine Zufallsgröße, die durch Transformation der Originaldaten gebildet wird. Dies gilt insbesondere für Einkommensdaten.
Definition (logarithmische Normalverteilung)
̈ße X, die nur positive Werte annehmen kann, heißt logarithmisch normalverteilt (kurz: log-normalverteilt) mit den Parametern μL und σL2, X ∼ LN(μL, σL2), wenn gilt:
ln(X) ∼ N(μL,σL2).
Prof. Burgard (FU Berlin) Schließende Se 21/22 42 / 48
− 1 ln(x )−μL 2 f(x)=√ ··e2 σL
F(x) = P(X≤x)
= P (ln(X) ≤ ln(x))
ln(x) − μL =Φ σL
Prof. Burgard (FU Berlin) Schließende Se 21/22 43 / 48
−2 0 2 4 6 8 10 x, ln(x)
X ~ LN(1, 1)
ln(X) ~ N(1, 1)
0.0 0.1 0.2 0.3 0.4
σL2 a) E(X
程序代写 CS代考 加微信: powcoder QQ: 1823890830 Email: powcoder@163.com