As2 Wiederholung
Allgemein
- Mittelwert (Lageparameter) $\bar{x} = \frac{1}{n} \sum x_i$
- Varianz (Streuungsparameter) $s^2 = \frac{1}{n-1} \sum (x_i - \bar{x})^2$
- Standardabweichung $s = \sqrt{s^2}$
Regression
- Punktepaare $(x_i, y_i) \rightarrow y = mx + t$
- Steigung $m = \frac{SP_{xy}}{SQ_x} = \frac{\sum (x_i - \bar{x}) (y_i - \bar{y})}{\sum (x_i - \bar{x})^2}$
- Pearson'scher Korrelationskoeffizient $r = \frac{S_{xy}}{S_y S_x} = \frac{\frac{1}{n-1} SP_{xy}}{\sqrt{\frac{1}{n-1} SQ_x \frac{1}{n-1} SQ_y}} = \frac{SP_{xy}}{\sqrt{SQ_x SQ_y}}$, wobei dieser ein einem Intervall zwischen -1 und 1 liegen muss.
- Bestimmtheitsmaß $B = r^2$ beschreibt den Anteil der durch das Modell erklärten Streuung
- Durch Anwendung der Kleinstquadratmethode wird die Fehlerquardatsumme minimiert, so dass die Abweichung zwischen Modell und tatsächlichen Daten möglichst gering wird. $SQ_e = \sum y_i - (mx_i + t)^2$
| Korrelationskoeffizient | Aussage |
|---|---|
| r < 0,5 | schwach |
| 0,5 < r < 0,8 | mittel |
| r > 0,8 | stark |
- Spannweite $R = x_{max} - x_{min}$
Diagramme
- Häufigkeitsdiagramm
- absolute Häufigkeit h: $\bar{x} = \frac{1}{n} \sum h_j x_j = \sum \frac{h_j}{n} x_j$
- Summenhäufigkeitsdiagramm $H(x_j) = \sum h_i x_i$
- Quartile
- Datenpunkte sortieren
- Nummerieren und damit Rang verteilen
- Median bilden = Q2
- n gerade: Mittelwert der mittleren Werte
- n ungerade: mittlerer Wert
- Median der unteren Hälfte = Q1
- Median der oberen Hälfte = Q3
- Q0 = xmin
- Q4 = xmax
- Boxplot
- Interquartilsabstand $iqr = Q_3 - Q_1$
- xi ist Ausreisser, wenn $x_1 \not\subset [Q_1 - a \cdot iqr; Q_3 + a \cdot iqr]$
- a = 1,5: mild
- a = 3,0: extrem
Seiten Revision: 6, zuletzt bearbeitet: 27 Oct 2010 09:47





