As2 Uebung2

2.V.1 Formel Wahrscheinlichkeitsrechnung

  • $P(E) > 0$ Wahrscheinlichkeiten sind nicht negativ
  • $P(S) = 1$ Wahrscheinlichkeit eines sicheren Ereignisses ist 1
  • $P(A \cup B) = P(A) + P(B)$ Wahrscheinlichkeit, dass von zwei unvereinbaren Ereignissen $A \cap B = \emptyset$, das eine oder andere eintritt ist die Summe aus beiden Einzelwahrscheinlichkeiten
  • $P(A \cup B) = P(A) + P(B) - P(A \cap B)$ Additionssatz
  • $P(E) + P(\bar E) = 1$ Gegenwahrscheinlichkeit
  • $P(E | B) = \frac{P(E \cap B)}{P(B)}$ bedingte Wahrscheinlichkeit
  • $P(E_i | B) = \frac{P(B | E_i) P(E)}{P(B)}$ Satz von Bayes
  • $P(B) = \sum P(B | E_i) P(E_i)$ totale Wahrscheinlichkeit

2.V.2 Baumdiagramm

Beispiel: Altersbefragung bei Studierenden
baumdiagramm.png

2.V.3 Verteilungsfunktion und Dichte einer stetigen bzw. diskreten Zufallsvariablen

  • diskret $E(X) = \sum_\infty^{-\infty} x_i p_i$
  • stetig $E(X) = \int_{-\infty}^{\infty} x p(x) dx \qquad P(x<X) = \in_{-\infty}^{x} p(x) dx$

2.U.1 Baumdiagramm, bedingte Wahrscheinlichkeit

a) Baumdiagramm für die Großväter und die Deutschlandspiele
ue2a2_baumdiagramm.png

b) Wahrscheinlichkeit, dass Deutschland gewinnt (G) und beide Großväter (B) vor dem Fernseher sitzen?

(1)
\begin{align} P(B \cap G) = 0,6 \cdot 0,8 = 0,48 \end{align}

c) Wahrscheinlichkeit, dass Deutschland überhaupt gewinnt (G)?

(2)
\begin{align} P(G) = P(B \cap G) + P(\bar{B} \cap G) = 0,48 + (0,4 \cdot 0,1) = 0,52 \end{align}

d) Wahrscheinlichkeit, dass mindestens einer der Großväter es versäumt, dass Deutschland gewinnt?

(3)
\begin{align} P(\bar{B} | G) = \frac{P(\bar{B} \cap G}{P(G)} = \frac{0,04}{0,52} = 0,077 \end{align}

2.U.2. Vierfeldertafel, Simpsons Paradoxon

a) Tabelle der Behandlungen für die Männer, ausgehen von der Gesamttabelle minus der Frauentabelle

Männer S D ges.
A 120 80 200
B 20 20 40
ges. 140 100 240

b) Angabe von Wahrscheinlichkeiten für die einzelnen Geschlechtertabellen. Hier erfolgt eine Interpretation der relativen Häufigkeiten als Wahrscheinlichkeiten

(4)
\begin{eqnarray} P_F(S) = \frac{316}{360} = 0,88 & P_M(S) = \frac{140}{240} = 0,58 \\ P_F(S | A) = \frac{95}{100} = 0,95 & P_M(S | A) = \frac{120}{200} = 0,6 \\ P_F(S | B) = \frac{221}{260} = 0,85 & P_M(S | B) = \frac{20}{40} = 0,5 \end{eqnarray}

Bei dieser Betrachtung ist für beide Geschlechter die Behandlungsart A die bessere, da hier die Überlebenswahrscheinlichkeiten höher sind.

c) Betrachtung der Überlebenswahrscheinlichkeiten für beide Geschlechter zusammen

(5)
\begin{eqnarray} P(S) = \frac{456}{600} = 0,76 \\ P(S | A) = \frac{215}{300} = 0,72 \\ P(S | B) = \frac{221}{260} = 0,81 \\ \end{eqnarray}

Nun ist die Behandlungsmethode B die günstigere, da die Überlebenswahrscheinlichkeit auf einmal höher ist. Gründe für die Abweichung kann man in der falschen Gewichtung der Daten suchen:

  • es gibt einen großen Unterschied zwischen der absoluten Überlebensrate bei Männer und Frauen (0,88 <-> 0,56)
  • es haben mehr Frauen bei der Behandlung B mitgemacht als Männer

Um dieses Simpson Paradoxon zu beseitigen gibt es folgende Auswege:

  • getrennte Berechnung (stratifizierte Analyse, Schichtenbildung)
  • Geschlecht als Variable z.B. bei der linearen Regression berücksichtigen

d) Betrachtung aller Ereignisse als unabhängig und Ermittlung der Wahrscheinlichkeiten aus den gegebenen Randhäufigkeiten am Beispiel der Frauentabelle.

Frauen S D ges.
A (100 * 316) / 360 = 87 12,2 100
B 228 (260 * 44) / 360 = 31,7 260
ges. 316 44 360

Nicht alle Zellhäufigkeiten entsprechen den beobachteten Werten. Um herauszufinden, ob das ein Zufall ist, müssen Tests durchgeführt werden.

Seiten-Tags: statistik übung
Sofern nicht anders angegeben ist der Inhalt dieser Seite unter Lizenz Creative Commons Attribution-ShareAlike 3.0 License