2.V.1 Formel Wahrscheinlichkeitsrechnung
- $P(E) > 0$ Wahrscheinlichkeiten sind nicht negativ
- $P(S) = 1$ Wahrscheinlichkeit eines sicheren Ereignisses ist 1
- $P(A \cup B) = P(A) + P(B)$ Wahrscheinlichkeit, dass von zwei unvereinbaren Ereignissen $A \cap B = \emptyset$, das eine oder andere eintritt ist die Summe aus beiden Einzelwahrscheinlichkeiten
- $P(A \cup B) = P(A) + P(B) - P(A \cap B)$ Additionssatz
- $P(E) + P(\bar E) = 1$ Gegenwahrscheinlichkeit
- $P(E | B) = \frac{P(E \cap B)}{P(B)}$ bedingte Wahrscheinlichkeit
- $P(E_i | B) = \frac{P(B | E_i) P(E)}{P(B)}$ Satz von Bayes
- $P(B) = \sum P(B | E_i) P(E_i)$ totale Wahrscheinlichkeit
2.V.2 Baumdiagramm
Beispiel: Altersbefragung bei Studierenden

2.V.3 Verteilungsfunktion und Dichte einer stetigen bzw. diskreten Zufallsvariablen
- diskret $E(X) = \sum_\infty^{-\infty} x_i p_i$
- stetig $E(X) = \int_{-\infty}^{\infty} x p(x) dx \qquad P(x<X) = \in_{-\infty}^{x} p(x) dx$
2.U.1 Baumdiagramm, bedingte Wahrscheinlichkeit
a) Baumdiagramm für die Großväter und die Deutschlandspiele

b) Wahrscheinlichkeit, dass Deutschland gewinnt (G) und beide Großväter (B) vor dem Fernseher sitzen?
(1)c) Wahrscheinlichkeit, dass Deutschland überhaupt gewinnt (G)?
(2)d) Wahrscheinlichkeit, dass mindestens einer der Großväter es versäumt, dass Deutschland gewinnt?
(3)2.U.2. Vierfeldertafel, Simpsons Paradoxon
a) Tabelle der Behandlungen für die Männer, ausgehen von der Gesamttabelle minus der Frauentabelle
| Männer | S | D | ges. |
|---|---|---|---|
| A | 120 | 80 | 200 |
| B | 20 | 20 | 40 |
| ges. | 140 | 100 | 240 |
b) Angabe von Wahrscheinlichkeiten für die einzelnen Geschlechtertabellen. Hier erfolgt eine Interpretation der relativen Häufigkeiten als Wahrscheinlichkeiten
(4)Bei dieser Betrachtung ist für beide Geschlechter die Behandlungsart A die bessere, da hier die Überlebenswahrscheinlichkeiten höher sind.
c) Betrachtung der Überlebenswahrscheinlichkeiten für beide Geschlechter zusammen
(5)Nun ist die Behandlungsmethode B die günstigere, da die Überlebenswahrscheinlichkeit auf einmal höher ist. Gründe für die Abweichung kann man in der falschen Gewichtung der Daten suchen:
- es gibt einen großen Unterschied zwischen der absoluten Überlebensrate bei Männer und Frauen (0,88 <-> 0,56)
- es haben mehr Frauen bei der Behandlung B mitgemacht als Männer
Um dieses Simpson Paradoxon zu beseitigen gibt es folgende Auswege:
- getrennte Berechnung (stratifizierte Analyse, Schichtenbildung)
- Geschlecht als Variable z.B. bei der linearen Regression berücksichtigen
d) Betrachtung aller Ereignisse als unabhängig und Ermittlung der Wahrscheinlichkeiten aus den gegebenen Randhäufigkeiten am Beispiel der Frauentabelle.
| Frauen | S | D | ges. |
|---|---|---|---|
| A | (100 * 316) / 360 = 87 | 12,2 | 100 |
| B | 228 | (260 * 44) / 360 = 31,7 | 260 |
| ges. | 316 | 44 | 360 |
Nicht alle Zellhäufigkeiten entsprechen den beobachteten Werten. Um herauszufinden, ob das ein Zufall ist, müssen Tests durchgeführt werden.





